【株式会社モルフォ】あなたの手元で動くAI技術 ―「使える」AI技術開発の魅力と課題―(1)

Acaric Journal
この記事は約8分で読めます。

「AJ出張版」は、株式会社アカリクが発行する「大学院生・研究者のためのキャリアマガジン Acaric Journal」の過去の掲載記事や、WEB限定の新鮮な記事をお送りするカテゴリです。今回はvol.1の掲載記事をお届けします。

株式会社モルフォは、広く携帯電話端末に搭載される画像処理ソフトウェアを提供しています。AI技術は、精度向上などの機能面が注目されますが、運用する場合にはバッテリー消費や計算量、AI部分以外のセンサー機能などの制約を様々に受けます。そのような制約を潜り抜けて「使える」AI技術として提供されるモルフォの製品は、国を超えて多くの方々の手に届いています。

― 株式会社モルフォのAI関連の技術や製品について教えてください

猪俣:全部いち押しですが、モルフォとして特に推しているのはMorpho Semantic Filtering™(モルフォセマンティックフィルタリング)とSoftNeuro®(ソフトニューロ)ですね。Morpho Semantic Filtering™は「セマンティック・フィルター」というAI技術を使って、例えばポートレート写真を撮った時に、肌や髪の毛などの人間の各部位をAIの目で認識することで、適切な画像処理をかけるための重要なヒントを提供するものです。SoftNeuro®は「推論エンジン」と呼ばれるもので、今話題の「ディープラーニング(deep learning:深層学習)」などのモデルを様々なプラットフォーム上で非常に高速に動かすことが可能となる製品です。

平賀:Zoomでは背景が自動的に抜かれますが、同様に髪の毛や肌、洋服、空、建物などを全てピクセル単位で認識し、それぞれに異なるフィルターをかけることができます。例えば、肌をスベスベにしてシミやシワを目立たなくしたり、空の青色をより鮮やかにするなどの画像処理を施して、写真をより綺麗に見せるということを、スマートフォンの中でリアルタイムに近い形で実現する技術がのMorpho Semantic Filtering™です。ディープラーニングは一般的にはクラウド上のサーバーでGPUを使って処理するケースが多いのですが、皆さんがお持ちのスマートフォンやデジタルカメラ、パソコン内蔵カメラ、監視カメラなどで撮影した写真を、より綺麗にするための技術を開発しています。2021年にはいくつかのメーカーから出てくる商用端末に搭載される予定です。この技術はスマートフォン用チップで世界最大手のQualcomm社と共同開発していまして、2020年にはEdge AI and Vision Allianceというカメラ関連のソフトウェアやハードウェアのアメリカの業界団体からBest AI Software / Algorithm Awardを受賞しています。

SoftNeuro®はMorpho Semantic Filtering™にも使われている要素技術で、スマートフォン、パソコン、監視カメラといったエッヂデバイスの中でも高速にディープラーニングの推論ができるようにするための技術です。世界最高速度が実現できる技術ということで、SoftNeuro®も2018年にEdge AI and Vision Allianceから賞を頂きました。ちなみに2019年にもMorpho Video Processing Solutions™という技術で同団体から受賞しています。動画系のソリューションですが、3年連続で賞を頂いてるのはうちとintelくらいではないかと思います。

― 多くの賞を取っていらっしゃるのですね。AI系のサービスは「性能は良いけれど、処理が重すぎて業務には使えない」ことが多々あるのですが、運用を第一に考えて作られている印象を持ちました

平賀:とりあえずAIの検証をやってみたけれど、AIを導入するより従来どおり人手で行った方がコストが安くなるというケースはあります。ですので、そのあたりの見極めが必要です。しかし、AIやディープラーニングはあくまで道具の一つにすぎないので、そのようなものをいかに実際に使える状態へ持っていけるかというのは、大きな課題だと感じます。

平賀:弊社の猪俣さんはモルフォ中ではAI系の中心人物で、小林さんは静止画系、佐藤さんは動画系のそれぞれ中心人物です。静止画や動画を扱う際にも、AIは使いどころが難しいです。静止画系はAIが使われつつある感じがしますが?

小林:そうですね。AIを静止画に使うケースは、大きく分けると二つあります。一つ目は先ほどのMorpho Semantic Filtering™の使い方です。古典的な画像解析・画像処理手法は、「画像の各点における色を解析して、その色をどのように加工すればより綺麗に見えるのか」を判断するのは得意です。一方で、画像内の各領域に人の顔や空などが写っているという、画像の意味を判断するのはとても難しく、そちらはAIの方が得意な処理です。例えば、空の青色を綺麗にしたいという、人の感性に近づけるような画像処理をしたい場合は、AIと絡めた方が良いというのが、Morpho Semantic Filtering™の目的です。もう一つはディープラーニングを使って、絵そのものを作り出すようなアプローチもあります。例えば、ピンボケした画像が撮れた場合に、古典的な手法で画像処理を行って鮮明な絵を作ることも可能なのですが、どうしても限界があります。ボケてしまっている部分の情報を、その周囲から寄せ集めて補完して作るというアプローチしか取れず、無から情報を生み出すことができないためです。AIを駆使すると、無から情報を生み出すような、若干インチキのようなことができます(笑)。補完に頼らないアプローチが取れるようになり、これまでの手法よりも格段に綺麗に見える絵を作れるようになったというのが、ここ最近特に発展してきた点になります。

平賀:動画系ではまだあまりAIが活用されていないのですが、これからはどうでしょうか?

佐藤:今開発しているものとなると、オートフレーミング技術があります。例えば、ビデオ会議を広角で撮って、その中から顔を検出して、顔があるところだけを切り出したりできます。ただ、スマホに搭載されているような画像処理系にAIを使おうとすると、動画は数十秒から数分単位の長い時間動かすため、お客さんが処理速度や消費電力をとても気にされます。使うとクオリティは良くなるが処理速度が足りない、処理速度は足りるが端末が熱くなる、といったデメリットが出てきますと実際に運用するのは難しいですし、使いどころも狭くなってきます。別に使わなくてもいいところにとりあえずディープラーニングを経由させて「ディープなんとか」と言っておけばいい、というような話も世の中的にはおそらくゼロではないと思います。そのような中で、技術的に意味のある使い方をするためには、いろいろと考えなければなりません。ただ、センスの良い使い方はあると思うので、そこを追求したいです。

平賀:動画系であれば、スマホのマーケティングとして「AIを使っている」と謳う場合もあります。

佐藤:AI手ブレ補正といったような言い方をするとキャッチーになりますからね。ただ、顔を使ったソリューションや、セマンティック的な何かを使うとなると、AIを使わければいけません。各社がAIなんとかを謳っていて、機械学習の使い道は多いと思うのですが、本当にディープラーニングが必要なのかは疑問に感じることがあります。

平賀:何気に我々もAIなんとかというソリューションを提供していたりしますが・・・。

佐藤:動画手ぶれ補正をAIでやろうとしても正解がないのでどうすればいいか分からん、という話にもぶち当たってくるので、考えなければなりません。

平賀:これまでスマホを中心にお話しましたが、AIの活用という点ではADAS(先進運転支援システム)や自動運転に向けた活用も一方ではあります。

猪俣:株式会社デンソーと共同研究でAI技術の開発を行っています。一例としては、車に乗っているカメラから外を見て、道路の領域や歩行者を検出する技術があります。また他には、カメラに映っているものと車との距離はどのくらいあるかという推定を行うタスクである単眼depth(深度)推定など、様々な画像認識技術を開発しています。このような技術は車載に限定されず、モバイル分野などにも展開していけます。

平賀:猪俣さんは、デンソーの方と一緒に論文を発表されてますよね。

猪俣:はい。depth推定とセマンティックセグメンテーションの融合という内容で論文を発表しています。

「あなたの手元で動くAI技術 ―『使える』AI技術開発の魅力と課題―(2)」はこちら

プロフィール(インタビュー当時)

平賀 督基 氏

株式会社モルフォ代表取締役社⻑。1974年東京都生まれ。2002年東京大学大学院理学系研究科情報科学専攻博士課程修了。博士(理学)。2004年画像処理技術の研究開発や製品開発を行う株式会社モルフォを設立。モルフォの画像処理ソフトウェアは2006年6月にNEC製携帯電話端末に搭載されたのを⽪切りに、国内外の携帯電話端末メーカーに幅広く採用されている。2010年に日経BP社主催の「日本イノベーター大賞」優秀賞を受賞。

猪俣 哲平 氏

株式会社モルフォCTO室シニアリサーチャー。1979年神奈川県生まれ。2010年慶應義塾大学大学院博士課程修了。博士(工学)。同年モルフォに入社。現在はSoftNeuro®など深層学習を用いた画像認識技術の研究開発を担当。

小林 理弘 氏

株式会社モルフォCTO室マネージャー(リサーチャー)。1983年神奈川県生まれ。2010年東京大学大学院情報理工学系研究科電子情報学専攻博士課程修了。博士(情報理工学)。半年間ポスドクに就きつつモルフォにアルバイトで従事し、2011年モルフォに入社。現在はPhotoSolidやHDRなど、静止画向けの画像処理技術の開発責任者を担当。

佐藤 真希 氏

株式会社モルフォCTO室シニアリサーチャー。1983年兵庫県生まれ。2011年京都大学大学院博士課程修了。博士(理学)。同年モルフォに入社。現在では電子式動画手ブレ補正など動画向け技術の研究開発を担当。

タイトルとURLをコピーしました