26卒
2024/04/30 公開
【ELYZAについて】
ELYZAは「未踏の領域で、あたりまえを創る」というミッションのもと、大規模言語モデル(LLM)の社会実装を推進しています。2020年に独自のLLMを開発して以来、自然言語処理分野におけるプロダクトの開発を通じ、多様なビジネスや社会課題の解決に貢献しています。
【ELYZAのLabチーム全体のミッション・思い】
「日本語汎用・業界特化の独自LLM開発」と「LLMの実用化に向けたプロダクト開発」において、AI開発プロジェクトをリードし、社会や企業に対してバリューを出す事が最大のミッションです。
【募集背景】
ELYZAのLabチームでは、日本でインフラとして「使われる」基盤モデルの開発に向け、研究開発に取り組んでいます。その研究開発を加速させるため、Labチームの採用を強化しています。
昨年、KDDIとの業務提携を結び、国内最大規模の計算機基盤の構築を進めてきました。今後はそのリソースを活用し、研究業界をリードする取り組みを行なっていきます。飛躍的・革新的なアウトプットをより充実させ、国内でも有数の研究開発チームを作っていくために、新たな仲間を募集しております。
【本ポジションの求める期待・役割】
ELYZAの競争優位性の源泉となる研究開発を推進していただきます。
◆昨今の生成AI、LLMの情勢や先行研究を踏まえ、研究開発における目標・課題を自律的に設定すること
◆目標や課題に対し、適切なアプローチを選定、必要に応じて情報収集を行うこと
◆時に泥臭い作業も厭わず、目標に対してオーナーシップを持って取り組むこと
◆他メンバーとの柔軟な議論と協力を通じて業務を遂行すること
【具体的な業務内容】
LLMや生成AI全般の開発に係るサーベイ、データ準備、学習、評価といった業務全般と、LLMの実用化に係るモデルの軽量化/高速化やRAGやAgentといったLLM活用に有用な要素技術の研究を幅広く行っていただきます。
◆LLM研究開発業務全般:
- 事前学習、SFT、フィードバック学習、強化学習、推論、評価等
◆周辺の要素技術の検証:
- マルチモーダル、エージェント、RAGの技術検証等
◆論文サーベイおよび社内共有
◆技術ブログの執筆
◆学会参加(スポンサーとしての参加も含む)
【開発環境】
◆開発言語:Python, (Shell Script)
◆インフラ:Azure, Google Cloud, AWS, ABCI
◆コンテナ基盤:Docker, Singularity
◆機械学習関連ツール:Hugging Face, W&B
◆ドキュメント・バックログ管理:Notion
◆コード管理:GitHub
◆コミュニケーションツール:Slack, Google Meet, Discord
【本ポジションの魅力】
◆国内最高水準のLLMを開発してきた中で蓄積された技術知見やアセットを活用して研究開発に取り組める点
◆国内最大規模の計算機基盤 (A100/H100数百基相当) を利用したLLM、マルチモーダルモデルの研究開発が行える点
◆経産省主導の「GENIAC」や、産総研の「生成AI開発支援プログラム」など、国の研究開発プロジェクトにも複数採択されており、スケールが大きく責任感のあるプロジェクトに携われる点
◆社内のデータアノテーションチームと協働し、高品質なデータ作成を伴う研究サイクルを高速に回せる点
◆実際に社会実装された自社プロダクトに紐づくモデルをブラッシュアップできる点