25卒
2024/07/31 公開
アスタミューゼには、未来を創るためのデータ情報源として、世界各国の産業における各技術領域ごとの基礎研究段階、応用開発段階、事業化・社会実装段階の技術情報、および研究投資情報など新たなイノベーションを生み出す源泉となるデータを保有しています。
【イノベーションデータリソース(世界193カ国、7億件超のデータベース】
・イノベーター企業と投資額(VC・M&Aデータ)
・研究テーマと投資額(グラントデータ)
・商品アイディアと投資額(クラウドファンディングデータ・CtoCデータ)
・技術データ(特許・論文)
・3Dプリンターデータ(3Dデータ)
当ポジションの方には、高度な分析から客観性・納得感の高いイノベーション創出のためのプロダクト、アルゴリズムを構築いただきます。
上記のデータは、テキストデータや画像データ、グラフ、表データなど複合的な内容のため、様々な分析手法を検討して実装いただきます。コンピュータサイエンス、統計学、数理科学などを駆使して分析・構造化し、コンサルティング提案や自社サービスに必要なデータ・示唆を導き出します。
そのため、エンジニアもクライアントMTGに同席し、課題やアウトプットイメージを直接ヒアリングして分析手法を考え、高い品質での提案に繋げております。
例えば、官公庁案件は、人的ネットワークの分析など民間企業での分析手法では対応出来ない困難なケースも多く、データドリブンで根拠のあるデータから解析を行える点を評価いただいております。また、脱炭素領域では、GPIFの報告書や日経新聞などにも評価と分析結果が掲載されました。
社内にはアカデミア(大学の助教授、博士号取得者)、研究者出身の社員が多くいることから、エンジニアが分析した結果を根拠のあるデータとして提供することが出来ております。
【業務詳細】
・お客様の社内外のデータ収集及び統計解析に適した形への集計・加工処理
・弊社サービスにおける機械学習の応用。多様なフォーマットのコンテンツを適切にクライアントへ届けるためのアルゴリズム(特許・論文・科研費など専門性の高いテキストのキュレーション、翻訳など)の開発、精度検証
・ビジネス課題に応じた効果的な統計解析手法の選定
【仕事の魅力】
世界中のイノベーションに関する網羅的なデータに加え、特許や論文などの独自性の高いデータを適切に活用していく事で、多くの(他社の)コンサルティング提案を受けてきたお客様が見聞きしたことのない意外性かつ実現性の高い提案をすることができます。
【開発手法】
言語: Python
インフラ: Google Cloud Platform (実機はありません)
データベース: PostgreSQL
DWH: BigQuery
ワークフロー: Google Cloud Composer (Apache Airflow)
その他ミドルウェア: Dataflow(Apache Beam), Dataproc(Apach Spark) , Cloud Run
その他開発環境: GitLab, Slack, Growi
個人環境: Mac/Windows/Linux(選択いただけます), Docker
機械学習ライブラリ:scikit-learn, PyTorch, TensorFlow, transformers, numpy, pandas, RAPIDS など
プロジェクト管理: Asana, GitLab, Jenkins
開発手法:プロジェクトごとに選択、スクラム、チケット駆動開発
【開発環境】
・フルリモート可(入社直後はご出社いただきます)
・本人のご希望に応じたPC環境を手配します(限度額はございます)
・OSはWindowsとMacのどちらも選択可能です
・服装自由、イヤホン可、フリーソフト利用可能です
【技術向上、教育体制】
・外部の勉強会への参加や発表を奨励しています(Developers Summit、AWSサミットなど1日のものも対象)
・書籍は会社の経費で購入できます
・社内勉強会を週1の持ち回り制で行っています
【その他、働き方】
・フレックス制を導入しており、コアタイムは10:30~17:30となっています。
・それぞれが課されたタスクによって、自分にあった仕事の仕方ができるので、みんな出社時間・帰社時間はバラバラです。だからこそ皆気にせず定時に帰れる雰囲気があります。
・一部リモート/フルリモートのメンバーもおり、Slack・Google Meet・Zoomなどのコミュニケーションツールを活用しています。
※現在はリモートワークを推奨。チーム開発の生産性などを考慮して、リモート/出社の両形態で柔軟に対応しています。