前回の記事「あなたの手元で動くAI技術 ―『使える』AI技術開発の魅力と課題―(1)」はこちら
― お話を伺っていると、スマホのバッテリーや処理能力の限界が一つ課題としてあり、またAIをどこに使うかというセンスも課題であるということでしたが、これらの課題を今後どのように突破されていくのでしょうか?
平賀:スマホAI専用DSP(デジタル信号処理)が搭載されつつあり、これによって消費電力も少なく高度な処理ができるようになってきています。ただし、これをうまく利用するためには、DSPでうまく走るような形でモデルアーキテクチャ自身を設計しなくてはいけないという課題が残ります。ソフトウェアだけではやはり解決できないのです。もちろんソフトウェアにも工夫する余地はありますが、ハードウェアとソフトウェアの連携が重要になってきています。それはAIだけではなく、動画のリアルタイム処理や静止画の処理についても同じことが言えます。このようなハードウェア、ソフトウェアの連携がこれからはより重要になると感じます。
小林:チップが変わるとAI側の推論も処理速度が変わってくるようで、それが先ほどの「画像の意味を判断する」ところの画像処理のクオリティにダイレクトに効いてきます。人物の部分を抜き出す部分も、AIの精度を上げられれば、画像処理側はあまり困らないのですが、AIの精度が下がれば下がるほど画像処理側で補う必要があり、AIだけの問題にとどまらない点が連携する際に難しいところです。
平賀:AIだけではなく、例えば静止画のイメージパイプラインやロードメイン(RAW domain)の処理も、ハードウェア側との連携が重要になってきますね。
小林:そうですね。今会社として取り組んでいることの一つに、ロードメインの画像処理があります。一眼レフカメラで写真を撮る方はRAW現像という用語を聞いたことがあると思うのですが、普段写真を撮ると、JPEGファイルで出てきますよね?そのJPEGを作る前の、カメラのセンサーから出てきた直後のデータをRAW data(生データ)と呼びます。そこにカメラの中で様々な画像処理を加えることによって、最終的にJPEGの絵が作られます。画像処理はパイプラインの構造になっているのですが、昔はパイプラインの中身は、我々のようなソフトウェアベンダーは全く触ることができず、パイプラインを通った画像に対して処理をかけていました。しかし、最近になってQualcommさんのようなチップベンダーと協力をすることで、パイプラインの途中に我々のようなサードパーティー製のソフトウェアを組み込むことができるようになり、ロードメインの画像処理ができるようになりました。画像データは、パイプラインを通って行く中で様々な情報が落ちたり、あるいは理想的な条件からどんどん外れてしまって、画像処理がやりづらくなることがあります。センサーに近い所に行けば行くほど、より情報が残っていたり、より画像処理をしやすい条件に近づいていくので、これまでできなかったような高画質の画像処理ができるようになってきています。今までの画像処理を一段突き抜けるような、新しい製品の研究開発を今していて、そろそろ絵が出てくるところまで来ています。
平賀:そのような意味では、アカデミックな研究開発と、実際にスマホやセキュリティカメラ、デジカメで使われるための技術開発、研究開発はやはり違う部分があるのも事実かと思います。アカデミックな世界では、本当に性能だけ追求すればいいのですが、実際に使われるものとなると、消費電力や、今あるハードウェアや将来のハードウェアの進化も見据えつつ、最適なものを作る必要があります。また、動画はそれこそリアルタイム処理をしなければならないので、ハードウェアを活用しなければ話にならないですね。
佐藤:そうですね。ハードウェアを使った方が、例えば消費電力が半分になったとすると、それだけで訴求力が上がるので、いかにリソースをうまく使うかは課題ですし、重要なところです。
― AIというと、ヒトでいうと脳みそのイメージですが、ヒトには目や鼻や口がついていて、これらの部位のスペックがどんどん変わっていくような状況で、全体として機能するかどうかを考えなければいけない、とメタファー的に理解しようとしています
平賀:人間で言うと燃費が重要で、コンピュータ的には大食漢な人はあまり望ましくなくて、少食だけれどもすごいパフォーマンスが出る人の方が望まれる、ということになります。いわゆるカーボンオフセットのように、地球環境のためにも消費エネルギーについては重要になってきているので、AI開発もその点を考慮しなければいけないのです。
― 今後はこのようなことに取り組んでみたい、こういうことをやっている会社でありたいというビジョンを伺ってもよろしいですか
平賀:ビジョンとしては、いかに最先端なものをしっかり実用化できるかというところが、うちの会社の経営理念でもあるので、常にそういう会社でありたいです。やはりテクノロジーや新しい製品は世の中を変えていきますが、一方でいくら良いテクノロジーでも使われなければ意味がないので、その辺りをしっかり見極めて、実際に使われるものを開発していきたいです。あとは、エンジニアにとって働いていて楽しい、実際自分が作ったものが世の中で使われている状況を提供できる会社でありたいと思っています。いずれそれぞれが開発した物が製品化されて商用化されて、車の安全などののために使われる未来が来るはずですので、そういったものを「自分が作ったものだ」と言える会社であり続けたいです。あと、うちの会社の特徴としているスマホも車載もそうですが、日本だけに限定したビジネスをしてるわけではなく、スマホであればSamsung、LG、Lenovo、モトローラやXiaomiなど、海外のお客さんに製品を使ってもらえます。画像系の技術だからというのもありますが、自分たちが作ったものが世界中の人達に使ってもらえます。現時点でも売上の2/3程が海外からの売り上げなのですが、日本国内のみならず、海外で自分たちが作ったものが使ってもらえる会社であり続けたい、よりそれを促進していきたいと思っています。良い製品や良いサービスは、たくさんの人に使ってもらえるものですので、日本国内だけでなく世界中の人に使ってもらえるようなものを作りたいという信念があります。
プロフィール(インタビュー当時)
平賀 督基 氏
株式会社モルフォ代表取締役社⻑。1974年東京都生まれ。2002年東京大学大学院理学系研究科情報科学専攻博士課程修了。博士(理学)。2004年画像処理技術の研究開発や製品開発を行う株式会社モルフォを設立。モルフォの画像処理ソフトウェアは2006年6月にNEC製携帯電話端末に搭載されたのを⽪切りに、国内外の携帯電話端末メーカーに幅広く採用されている。2010年に日経BP社主催の「日本イノベーター大賞」優秀賞を受賞。
猪俣 哲平 氏
株式会社モルフォCTO室シニアリサーチャー。1979年神奈川県生まれ。2010年慶應義塾大学大学院博士課程修了。博士(工学)。同年モルフォに入社。現在はSoftNeuro®など深層学習を用いた画像認識技術の研究開発を担当。
小林 理弘 氏
株式会社モルフォCTO室マネージャー(リサーチャー)。1983年神奈川県生まれ。2010年東京大学大学院情報理工学系研究科電子情報学専攻博士課程修了。博士(情報理工学)。半年間ポスドクに就きつつモルフォにアルバイトで従事し、2011年モルフォに入社。現在はPhotoSolidやHDRなど、静止画向けの画像処理技術の開発責任者を担当。
佐藤 真希 氏
株式会社モルフォCTO室シニアリサーチャー。1983年兵庫県生まれ。2011年京都大学大学院博士課程修了。博士(理学)。同年モルフォに入社。現在では電子式動画手ブレ補正など動画向け技術の研究開発を担当。