多くのインターンに参加した天才である私は、ある真実に気づく。
そう、インターンに参加しても内閣総理大臣になれないということに!
いや、そんなわけはない。悲しくも人は簡単に真実を認めることができない生き物であります。
エウレカインターンもまた、そうなのです。
Pairsで有名なエウレカでAIエンジニアとして活動した2週間を通して感じたことを綴っていきます。
インターン概要
2週間のインターン。
前半課題があり、合格した人のみ後半に進むことができます。
デザイナーも参加しているため、後半ではデザイナーと共にチーム活動ができる
AIエンジニア以外はな!!!
ライバルに差をつける、"学び働く" 貴重な体験をしませんか?
メンターをつとめるのは、国内屈指のカンファレンスで登壇経験を持つ業界トップクラスのエンジニアとデザイナーたち。
本気のビジネスの楽しさを、この夏エウレカで体験しよう!
ともあれ、応募要項に記載されている謳い文句通りのインターンである。
参加動機と合格まで
SQLをそろそろ勉強したいと思っていた所、下記の記事を見つけた。
SQLで分析を始めた人に贈る、中級者に上がるための10のTips
記事を見て、インターンあるならSQL書きに行きたいなーと思って、検索するとありがたいことに学年不問だったため応募した。
一次面接では、地方大学ではモチベーションを保つのが辛いことや、情報工学を学べば学ぶほど限りない知によって、自分が馬鹿であることを知らしめられるみたいことを話した。
高校までは陸に足をつけ自分の場所がはっきりとわかるのですが、大学で真剣に学んでいると、広い海の中をあてもなく彷徨っている感覚に陥ります。広い海に一人ぼっちは怖いし辛い。周りに一緒に泳いでくれる人がいないため心がどんどん荒んでいく的なことを喋った気がする。
恥ずかしながら、人生相談のような面接をして頂いた。
何故か知らないが、面接を通過。
1次はSkype面接だったのだが、最終は東京に行くことに。
就職活動を通して、空港での時間の使い方が下手ということに気づき、東京に行くのは憂鬱だった。
赤羽橋という聞いたこともない駅に迷わず来れた自分を褒めてあげたいものだ。偉いぞ!
会社に訪問するまで、Pairsというサービスを知らなかったのでオフィス見学で様々な知見を得た。
出会い系とマッチングアプリの違いなどを知り、教育以外のことにも目を向けた方がいいんだなーと思った。(小並感)
そうこうしているうちに面接開始。
驚くことに、面接官はCTO。(最終日に卓球で負けたので、ドライブを覚えてボコボコしたい)
一言で言うとニートはいいなーっていう面接だった。
かなり狭く優秀層を見ている自覚はあるのですが、会うエンジニアは技術だけでなくデザインや広告、顧客とのコミュニケーションを取れる人が多く、エンジニア以外の職種がどのように生き残っていくのかを聞いたりして有意義な時間を過ごしました。
無事合格通知を頂けることに(特に技術的な話をしてなかったような‥ 印象に残ってないだけ?)
実は、福岡の屋台で常連客におでんを奢ってもらいたいという夢を叶えるため応募していた日経新聞のインターンにも合格を貰っていた。
どちらに参加するか迷ったが、期間的に長い方が学べることが多いと思いエウレカのインターンに行く旨を伝え、参加が決定。
待って貰ってありがたかった。
参加までにやったこと
サーバーサイドエンジニアとして、参加する予定だったのですがAIチームで参加しないかという旨のメールをもらい、二つ返事で許諾した。
しかし、研究室の課題としてPytorchとChainerでEncoder-Decoderモデルを組んだぐらいで不安しかなかったので、研究室にある本で事前学習を行った。
- 集合知プログラミング2.3章
- 自然言語処理100本ノック4章まで
- numpy100本ノック星1のみ
- ゼロから作るDeep Learning
- はじめてのパターン認識7章まで
また、Pairsをインストールしてどのようなタスクを行うのかを予測した。
Pairsでは、相手との相性がパーセンテージで表示されているためコミュニティの相関関係などを元に推薦を行うのではないかと思っていたが、違った。
事前課題で自然言語処理100本ノックが課されてたことからこの推測が正しくないことを判断できたのだが、不安で頭が回っていなかった。
前半
前半戦の課題は、青空文庫のコーパスを使って分類問題かクラスタリングに関するモデルを作成することでした。
社会人になれば当たり前にやることですが、自分で課題を設定するのが難しいということを知った。しかも、知識の少ない分野なら尚更。
必要なデータを収集するため、データ整形から行う必要があるためモデルに関する知識を深掘りせずに実装したのが、少し心残りです。
詳しい内容は、Githubに公開しているので気になった人は覗いてみて下さい。
GitHub
今なら、進化したシェル芸でpython書かなくても前処理できる気がする。
後半
何とか後半に進むことができた。
後半戦の課題は、自己紹介文の改善でした。
また、良い自己紹介の定義から行う、これまた難しい課題。
後半戦の内容は、秘密保持なんたらかんたらとかでどこまで公開していいのか難しいのですが、生データ使ってワイワイやっていました。
発表
全くもって、やってきたことを伝えることができなかった。
反省としては、プレゼン資料はチーム(2人)でフォーマットと型を決めるべきであると感じた。
前処理アイデアを五つぐらい実装したり、モデルに関しても代替案を考えていたのだが、その理由を準備していなかったため咄嗟に答えることができなかったのは、後悔が残っている。
最後まで詰めることができなかった。エンジニアとして、コードを書くだけならかなりの成果を上げたのではないかと思っているが、技術は単なる表現媒体であることを忘れ最終的なサービスへのイメージを共有できなかった。反省を次に生かしたい。
内閣総理大臣について
上記の内容は、正直どうでもいい話である。
ここからが本題です。
続きを読む