「AJ出張版」は、株式会社アカリクが発行する「大学院生・研究者のためのキャリアマガジン Acaric Journal」の過去の掲載記事や、WEB限定の新鮮な記事をお送りするカテゴリです。今回はvol.1の掲載記事をお届けします。
人工知能(AI)開発が世界的に盛り上がりを見せるなかで、医療・創薬といった分野でも膨大なデータを扱うことのできるデータサイエンティスト人材の育成が求められています。今回は、「医療・創薬系データサイエンティスト育成の最前線」と題して、東京医科歯科大学の竹内勝之先生と長谷武志先生にインタビューを行いました。
プロフィール
竹内 勝之 氏
東京医科歯科大学 統合教育機構 イノベーション人材育成部門 部門長・教授、大阪大学 数理・データ科学教育研究センター 招へい教授。現在、医療・創薬領域でのデータサイエンス教育の他、アントレプレナーシップ教育や産学連携教育にも従事する。また、長年、大学院生やポストドクター等若手研究人材のキャリア形成支援にも取り組む。
⻑⾕ 武志 氏
東京医科歯科大学 統合教育機構 イノベーション人材育成部門 特任准教授、慶應義塾大学 薬学部 客員准教授、SBX Corporation シニアサイエンティスト、特定⾮営利活動法⼈ システムバイオロジー研究機構 客員研究員、NPO法⼈ 次世代⽣命医学研究所 研究部⾨ 兼任研究員。バイオインフォマティシャンとしてAIやビッグデータを⽤いた創薬に関する研究に従事。博⼠(医学)。
ー データサイエンス人材の需要が様々な分野において高まっていますが、医療・創薬の領域でも高まってきているのですか
竹内氏 アカデミア(大学や公的機関)、産業界の両方において、データサイエンス専門人材の需要は高まってきています。しかし、データサイエンスに精通している人材の確保は容易でありません。例えば、アカデミアで活躍していたデータサイエンス分野の研究者が、産業界に転職するケースも見られるようになりました。他方で、産業界の中では、国内大手企業からベンチャー企業や外資系企業と言った“画一的でない”給与体系の法人に人材が流れているようです。また、製薬企業の方から、データサイエンスの専門性を有する大学院生のリクルートが難しくなっていると聞いたことがあります。
長谷氏 アカデミアで研究をしてきた⼤学教員やポストドクター(以下、ポスドク)が⼤⼿企業やベンチャー企業に移籍し、AIの開発などで活躍されているという例もあるようですね。また、ポスドクや任期付きの⼤学教員に限らず、国⽴研究機関でもプロジェクトリーダークラスが産業界へ移られるなど、アカデミアから産業界へ移籍している状況を目の当たりにしています。
竹内氏 データサイエンス専門人材全体が流動化してきていますね。特に、アカデミアから産業界へと移っていく動きが顕著になってきたと感じます。この動きはどのような動機から生まれているのでしょうか。
長谷氏 アカデミアに残るよりも、恵まれた環境で研究できることがあるからではないでしょうか。例えば、⺠間企業に移れば任期の⼼配をする必要がなくなります。中には、研究資⾦が潤沢な企業なども存在します。待遇⾯に関しても、アカデミア在籍時よりも給料が上がるということもありえます。
竹内氏 そのような実情から、アカデミアから産業界へデータサイエンス専門人材が流れるという動きが生まれているのですね。情報学など工学系の大学院の中には、博士前期課程(修士課程)を修了した大学院生の多くが民間企業に就職した結果、博士後期課程が定員割れとなっているところもあるようです。
ー 医療・創薬系の文脈ではデータサイエンス人材の育成について、どのような取り組みが行われているのですか
竹内氏 例えば、新しい研究分野であるAI創薬であれば、情報・工学・医学・薬学などの大学院に研究者が点在していますが、まだ、専攻やコースが開設されるまでには至っていません。AI創薬だけでなく、医療分野のデータサイエンスも同様です。しかし、滋賀大学や横浜市立大学などでは、医療・創薬の領域に特化していませんが、データサイエンスを教育する学部が開設されています。
他方で、大学院の専攻ではありませんが、東京医科歯科大学が代表機関として取り組んでいる人材育成活動のひとつである『医療・創薬データサイエンスコンソーシアム』(以下、MD-DSC)では、医療・創薬・ヘルスケア分野で活躍するデータサイエンス専門人材の育成に取り組んでいます。MD-DSCはデータ関連人材育成プログラム(文部科学省)の一環です。大学・企業・公的機関がコンソーシアムを形成し、多様なカリキュラムを提供しています。2020年度は、大学院生やポスドク等を対象とした「博士人材コース」には約70名、企業を対象とした「企業人材コース」には約30名が在籍しています。毎年、受講希望者が増えており、社会的なニーズの高まりを実感しています。
【参考】医療・創薬データサイエンスコンソーシアム
ー MD-DSCは「博士人材コース」と「企業人材コース」という2つの異なるコースが存在しているとのことですが、両コースで学ぶ内容は同じものなのですか
竹内氏 講義科目と実習科目については、博士人材コースと企業人材コースで共通のものとなっておりますが、各コースで修了要件が異なっています。例えば、博士人材コースの修了要件のひとつに企業インターンシップを選択することができます。代わりに、企業人材コースでは大学や公的機関が実施する研修を選択することができます。リアルワールドデータを扱う研修もあり、貴重な経験を得ることができます。昨年度から、一部の研修を博士人材コースにも開放しています。
ー 近年は日本の製薬会社でも「in silico創薬」を強化する動きが見られますが、アカデミアでの教育や研究でも【分子科学 × 情報工学】といった取り組みは活発に行われていますか
長谷氏 大学では研究室単位で行われているものが多いですが、中には企業と提携して創薬AIのパイプラインを作ろうとしている研究室もあるようです。
そのような中で、日本医療研究開発機構(以下、AMED)では、創薬支援効率化事業のひとつとして、「産学連携による次世代創薬AI開発」に関して大型の予算が割り当てられています※。このプロジェクトでは、参加する各々の企業の持つデータを共有できる包括的なAI創薬のプラットフォーム開発を目的としております。これまで個々の研究室単位で行われてきたAI創薬の取り組みが、AMEDのプロジェクトのもとで繋がり、組織的に動くことができるようになるという点では取り組みは活発に行われていると言えます。
※産学連携による次世代創薬AI開発(DAIIA)
ー 「医療データに特化したデータサイエンティスト」と「バイオインフォマティシャン」に明確な違いはありますか。それぞれどのようにすればなることができますか
長谷氏 「医療データに特化したデータサイエンティスト」と「バイオインフォマティシャン」は、使う⼿法(統計解析、機械学習)そのものについては似通っている⼀⽅で、それらを使⽤する⽅向性が異なります。例えば、医療データに特化したデータサイエンティストは電⼦カルテのデータや患者の付随データに対して統計解析・機械学習等を⽤いますが、バイオインフォマティシャンであれば、オミックスデータ、例えば遺伝⼦発現データや代謝物データなど、に対しての解析を⾏います。
どのようにすればデータサイエンティストやバイオインフォマティシャンになれるかについてですが、この点については画⼀的なトレーニング内容というものがあるわけではありません。修⼠課程までに統計解析や機械学習等を学んできた⽅でも、その後、博⼠課程で所属する研究室によって扱うデータも異なってくるため、⾃ずと習得すべきドメイン知識なども変わってくるからです。また、研究を⾏っていくうえで、扱うデータの種類を変更するということもありえます。
用語整理
AI創薬 / AI技術を用いた創薬
in silico / コンピュータを活用した方法
オミックスデータ / ⽣体分⼦に関する情報を網羅的に計測したデータ
ドメイン知識 / ある専門分野や業界・業種に特化した知識