日々の事柄に関する雑記帳。




はじめに
PART1ディープラーニングとは
PART2実用化されるディープラーニング
PART3ディープラーニングがもたらす未来

はじめに

「ディープラーニング」のしくみをわかりやすく説明することが困難
「ディープラーニング」を伝えることにとても苦労しています。

理由
  • 「ディープラーニング」登場以前に行われてきた研究も踏まえないといけない
    • アルゴリズム(例:ニューラルネットワーク)
    • 理解するための要素として必要な知識が多く、調べるだけで大量の時間を費やす
  • アルゴリズムを説明する際に数式を用いる
    • 技術的、数学的バックグラウンド、その理解に伴うハードルの高さ

PART1

正規化特徴量のスケールを0〜1の範囲に変換する。
標準化特徴量を平均0、分散1の正規分布に変換する。
標準化は機械学習全般に対して効果的であるものの、ディープニューラルネットワークの学習では効果が薄まるケースもあります。これに対しては、重みの初期値を工夫するという手法もとられます。

ディープラーニング発展のロードマップ
2012画像認識画像認識の精度向上画像による診断
広告
マルチモーダルな認識行動予測
異常検知
セキュリティ
マーケティング
2020ロボティクス自律的行動自動運転
物流の自動化
製造装置の効率化
インタラクション文脈に合わせた環境認識、行動家事、介護
他者理解
感情労働の代替
試行錯誤の自動化
2025シンボルグラウンディング言語理解翻訳
海外向けEC
2030知識獲得知識理解教育
秘書
ホワイトカラー支援

CNN

与えられた画像が何かを識別する。
CNNConvolutional Neural Network
畳み込みニューラルネットワーク
  • 畳み込み層
    • 3次元の画像を2次元化する。
    • 画像の位置情報を保存したデータ=特徴マップを得る。→画像の特徴を獲得する。
  • プーリング層
    • 画像サイズを小さくする。→次元の圧縮

データ拡張:画像データを自前で作成する。
  • 上下左右にずらす。
  • 上下左右を反転する。
  • 拡大、縮小する。
  • 回転する。
  • 斜めに歪める。
  • 一部を切り取る。
  • コントラストを変える。

層を増やす。→精度が向上する。→計算量が増える。

RNN

予測する。
RNNRecurrent Neural Network
回帰型ニューラルネットワーク

ニューラルネットワークの課題
  • 入力と出力のデータのサイズが固定される。
  • 異なる時間の入力情報のつながりを学習できない。
これらの課題をRNNは克服した。
LSTMLong Short Term Memory
  • 必要な情報を覚え、そうではないものを忘れさせる手法|
  • 前から後ろ(過去から未来)へ学習する。
BiRNNBi-directional RNN
  • 2つのLSTMを用いる。→双方向で学習する。
画像生成モデル
GANGenerative Adversarial Network
敵対性生成ネットワーク
敵対的生成ネットワーク
生成器+識別器
DCGANDeep Convolutional GAN生成器+識別器+CNN
生成器値を入力し、画像データを出力する。
識別器画像データを入力し、本物か偽物を識別する。
深層強化学習モデル
強化学習=報酬を与えることで、より効率的な行動を学習させる。
直接得られる報酬短期的損得
将来得られる報酬長期的損得
計算された報酬と、実際の報酬の差を縮めるように学習する。
AlphaGo棋譜を学習
AlphaGo Zero自己対局で学習→棋譜を用いない学習
その他
ディープラーニング企業
アメリカGoogle検索エンジン
アメリカNVIDIAGPU
GPGPU
イギリスdeepmindGoogle傘下
AlphaGoを開発
医療分野→目の疾患の画像診断システム
イスラエルMobileyeIntel傘下
車載画像認識を用いた高度運転支援システム
カナダElement AIAI研究
ヨシュア・ベンジオ(ディープラーニングの生みの親の一人)が設立
フランスShift Technology SAS自動補償請求処理
保険金搾取の検出
ロシアYandex検索エンジン
自動運転
タクシー配車アプリ
中国Baidu検索エンジン
自動運転
ニューラルネットワーク人間の脳を模した仕組み
ディープラーニングニューラルネットワークを多層化
機械が特徴量を選ぶ。
ニューラルネットワークの応用画像認識
自然言語処理
ロボティクス
GPGPUGeneral-Purpose computing on GPU
画像処理以外の用途に転用したGPU
GPUGraphics Processing Units
画面表示、画像処理に特化した演算装置

PART2

活用領域
  • 画像認識
  • 自然言語処理
  • 音声処理
  • ロボティクス強化学習

不良品の検品

  • 方法1:良品の特徴を学習させ、その特徴との差が大きいものを不良品とする。
    • 不良品の発生頻度が少ない→不良品データの学習が困難
    • 誤検知(良品を不良品として認識)は、再学習させる。
  • 方法2:機器の正常な動作音を学習させ、異常音を検知する。
  • 音声解析によるリアルタイム異常検知
  • 騒音の大きな場所でも検出可能
  • 人が立ち入れない場所でも活用可能

外観検査

ミクロン単位のキズが製品全体に影響を及ぼす部品メーカーでは、わずかの見落としも許されません。
  • 顕微鏡
  • CCDカメラ
  • レーザー照射→反射、屈折具合の確認
  • 磁気を利用してキズを探す
トヨタ自動車
シーイーシー
WiseImaging鍛造工程での不良品検出

バラ積みピッキング

MUJIN自動ロボット動作生成
  • 内蔵シミュレーターに学習させる。→細かな動作設定をしない。
作業場のレイアウトが変わると「一から設定し直し」となっていましたが、それも不要となります。
  • 干渉回避機能→高精度のピッキング作業を実現できる。

農業

オプティムピンポイント農薬散布システム外注のいる場所だけに農薬を散布する。
  • 不要な場所へ散布しない。
    • 農薬コスト削減
    • 安全性向上

ロボットタクシー

  • 高齢化による買い物難民の救済
  • 運転手不足の解消
  • ドライバーと利用者のトラブル
  • 渋滞の緩和
  • 交通事故の減少
ロボットタクシーの実現は、技術的な問題はほぼクリアされる段階のようです。
自動運転技術開発ZMP
3D測量アイサンテクノロジー

実証実験
ZMP
アイサンテクノロジー
遠隔型自動運転システム
DeNA自動運転2019年のサービス開始を目指す。
SBドライブ自動運転シャトルバス

交通需要予測

一説にはタクシーの空車率は50%ともいわれています。
ソニーでは、タクシーの乗車需要を予測して、乗車ニーズのありそうな方面をタブレット端末に表示するサービスをタクシー会社に提供します。
静岡鉄道では目的地が異なる乗客に最適な経路を提案するサービスの実験を進めています。

ドライバーの見守り

PUX見守りシステム開発居眠りやスマホ操作などの危険な状態をカメラが検知すると警告音を発する。
|オムロン|健康状態をチェックする技術|脈拍などの生体情報

診断支援

オリンパスEndoBRAIN腫瘍判定ソフトウェア
超拡大内視鏡を使用する画像解析
高度管理医療機器の承認を取得
富士フィルム診断支援
  • 画像診断
    • 細かな血管を強調する
    • 色の違いを強調する
      • 臓器認識
      • 疾患の検出、鑑別支援→見落とし防止、転移の検出
      • 医師の作業支援→類似症例検索、資料の半自動作成
高度情報科学技術研究機構(RIST)
三栄会ツカザキ病院眼科
網膜剥離診断システム

創薬

リード化合物:新薬のもとになる物質
  1. 病気に有効なリード化合物の発見
  2. リード化合物の最適化=有効性を高める構造式を作る→開発コストの大部分が消費される。
  3. 毒性試験、臨床試験
AtomwiseAI+スーパーコンピュータバーシャル・スクリーニング→分子構造を調べ、合成、試験する。
KAIST薬物の副作用を予測するシステム副作用の原因、副作用を抑える代替薬物の予測

ゲノム医療

がん治療に関する論文を学習させ、それを患者のゲノム情報と合わせることで、効果的な治療薬を特定する
日立製作所
国立遺伝学研究所
ゲノム解析支援システム患者個人に最適化された治療

介護コーチング

2025年には、65歳以上の高齢者が日本人のうち30%を占め、そのうちの20%が認知症患者になると予想されています。
20%×30%=6%
65歳以上高齢者の6%が認知症患者


  1. 介護初心者がケアしている様子を、熟練介護士が確認、アドバイスする。
  2. 熟練介護士のアドバイスを学習したAIが、解析、評価を行う。

ひび割れ・損傷の検出

  • 設備の老朽化
  • 5年に1回の目視点検義務
  • 土木業従事者の減少傾向

ディープ・ラーニングによる橋梁の点検、メンテナンスの効率化
  • 土木研究所
  • 日立製作所
  • 富士通
  • 三菱電機
  • 理化学研究所
富士フィルムひびみっけインフラの画像診断サービス
  1. 撮影画像を合成
  2. ひび、傷の検出→サイズの自動計算
  3. CADデータ出力

送電線の点検

送電線の点検業務は、十分に経験を積んだエキスパートが目視で行うのが現状です。ただ、異常検知する機会が少ないため、経験者の育成が進みません。

敵対性生成ネットワーク(GTAN)→偽の異常画像を生成し、画像認識モデルを学習する。
テラドローン産業向けドローン・サービス従来はヘリコプターを用いていた。

異常検知、予防保全

予防保全定期メンテナンス
予知保全故障の予兆を見抜く。
日立造船
日本IBM
ごみ焼却プラント最適管理システム
  • 熟練オペレータより先に異常検知する。
  • 燃焼パターンの予測
    • 効率よく燃焼させる条件
    • 排ガス、ダイオキシンの発生抑制
三菱エレベーター診断運転モード高度な予防保全

地盤回析、地質評価

ネットスマイル地盤解析ロボット
  1. 人力収集データを学習する。
  2. 人力解析でご認識されたデータを学習する。
  3. 正確で信頼性の高い解析結果を出力する。
安藤ハザマ
日本システムウェア
トンネル切羽AI自動評価システム岩盤強度を特定する。
画像だけで岩石の種類を特定する。
川崎地質路面陥没自動察知システム
  • 陥没の可能性が高い地下空洞を事前に検知する。→補修作業の効率化

自動掘削

フジタ
DeepX
経営共創基盤
油圧ショベル機の自動掘削 
夜のうちにAIが稼働し、昼に人間が微調整する

産業廃棄物選別

  • ゴミとリサイクル素材の選別
  • 分別作業の自動化
    • 処理能力向上→24時間稼働
    • 人件費抑制
    • 人手不足対策
Sadako Technologyゴミ自動分別ロボットベルトコンベアを流れるゴミの中から、ペットボトルだけを抜き取る。
ウエノテックス自動選別機ビンや樹脂を自動分別する。
分別後のデータを再学習する。

記事校閲、自動翻訳

校閲:誤字、脱字、表記ゆれ、検証、差別表現の有無を確認する。
凸版印刷校閲、構成システム助詞や漢字変換の誤りも検出できる。
NTTコミュニケーションズ翻訳エンジンビジネス文書の翻訳。
TOEIC900点レベル

広告クリック予測

一般的に、インターネット広告では事前に複数のパターンをテスト配信(A/Bテスト)して、効果を見てから実際の広告を配信する手法がとられています。
サイバーエージェント
電通
効果予測モデル、ツール広告主のデータを再学習し、効果の高い広告、低い広告を配信前に検知する。

キャラクター生成

データグリッドアイドル自動生成AI架空のアイドルを自動生成する。
  1. 現実のアイドル顔写真を学習する。
  2. アイドルの特徴を持った顔立ちの女性を自動生成する。
  3. 応用例:アニメやゲームのキャラクター、ダンジョン
Preferred Networksキャラクター生成プラットフォーム
  1. 複数のキャラクターの特徴を学習する。
  2. 合成し、特徴を引き継いだ新しいキャラクターを生成する。
  3. キャラクターの生成、合成、交換の取引データをブロック・チェーンで記録する。

スマート・スピーカー

AmazonEcho
AppleHome Pod
GoogleNest
Harman KardonINVOKECortanaを採用
LINEClova
アリババTmall Genie中国のBMWに搭載されている。

無人レジ

AmazonAmazon Go
モスバーガー無人レジ実証実験券売機ではない。
注文者の年齢、性別、感情を推測し、適したメニューを提案する。

顔認証
セブンイレブン
NEC
顔認証決済システム
  • 台湾のセブンイレブン無人店舗
    • 顔認証で入店し、カード決済する。
  • 個人情報保護→顔認証の代わりにID(社員証、学生証など)と連携する。

手話
シャープ
NTTデータ
ロボホン
ロボホン向け手話通訳アプリ
ロボホンに向かって手話で話しかけると、音声と文字に変換する。

万引き防止

日本の万引き被害額:4000億円/年
アースライズ
NTT東日本
万引き防止AIサービス行動検知AI+防犯システム
  1. 消費者行動パターンを学習する。
  2. 不信行動を検知すると、店員へ場所、画像を通知する。
VAAK万引き防止AI不審者を察知すると、アナウンスを発して犯行を未然に防ぐ。
  1. 万引きに関連する動画を学習する。
    1. 万引きを起こしやすい環境の分析→レイアウト改善
  1. 画像などをクラウドに保存する。

見積書作成

IBUKI自動作成システム
  • 次のデータを学習する。
    • これまでの見積書データ
    • 検討するチェック項目
    • ベテラン社員の経験値

物流画像判別、在庫管理

ロボットによる自動化荷物の梱包
荷物の積み下ろし
人間依存荷物の仕分け→大きさ、種類、送り先
NTTデータ
佐川急便
物流画像判別AIエンジン物流業務の自動化、最適化

自動盛りつけ

アールティ弁当の盛りつけロボット協働人型ロボット
製造ラインに人と並んで作業する。
人がやさしく手に取るような柔らかい具材のピッキングが難しい。
デンソーウェーブマルチモーダルAIロボットカメラと手のセンサーから得られる情報を学習する。指があり、サラダの盛りつけやタオルをたたむことができる。

ユーザーコメント分析

日立製作所感性分析サービス顧客の声を1300種類の話題、感情、意図に分類する。
言語理解研究所感情分析AIテキスト・データから商品、サービスに対するイメージ、感情を可視化する。
クーロンフェアプレイアルゴリズム誹謗中傷、罵詈雑言、違法な取引や出会い目的などの関連用語が含まれる言葉を自動的にフィルタリングする。

株価予測、不正取引検知

三菱UFJモルガン・スタンレー証券毎月10日を基準日として1か月後を予測する。
野村證券野村AI景況感指数
  1. 月例経済報告、金融経済月報などを学習する。
  2. 文言の意味を読み取る。
  3. 指数化
Danske Bank
TERADATA
不正取引検知システム

PART3

ディープラーニングを積極的に活用すべき分野(業務)
  1. 人間が時間をかけて見つける法則性や傾向を発見する。
  2. それに対する最適なパターンを計算によって導く。

ティープラーニングがもたらす変化
一流の技術を持つ人や企業がサービス提供する。提供価格が上がる。
ディープラーニングを導入する。提供価格が下がる
必要なデータ収集と学習、特に一流の技術を持つ人や企業からのデータ収集を伴う場合、2のシナリオでビジネス規模拡大+利幅拡大するのではないか?
1.人や企業の代わりにディープラーニングでサービス提供する。→提供価格が下がる。
2.提供価格を維持して、ディープラーニングでサービス提供する。


一流の技術を持つサービス提供者が生き残る構造
自動化や機械化が進めば、「リアルな空間」「リアルな体験」の付加価値が上がります。
リアルな空間や体験を提供できる、つまり価値ある時間を共有するサービスが提供できるのは、その人だけ。その付加価値に高い値段をつけることができます。
実際には一流のサービス提供者がディープラーニングを活用して、
・割引なしの価格でサービス提供する機会を増やし、
・サービス提供を省力化することで、利幅を増やす。
のではないかと思う。


活用しやすいデータの条件
  • 適正な形になっている
    • 分類が適切→表記ゆれ
    • データの体裁(ファイル形式)が揃っている→異なるファイル形式の混在
  • データの特徴を示す情報が多く、細かい
  • 欠損がない
    • 期間、年代などの抜け落ちはないか。
  • 偏りがない
    • ある事象や一部の現象のみを抽出していないか
  • 量が一定以上ある

必要な人材
想定できる人ディープラーニング適用場面、領域を見つけられる。
導入成果を想定できる。
動かせる人プロジェクトを実施する。
意思決定する人必要性を理解し、意思決定する。

必要な知識
  • ディープラーニングでできること、できないこと
  • ディープラーニングの強みと弱み
  • 技術導入に必要な要素(データなど)
  • 実用化されている商品、サービスの全体像
  • 新たに研究、開発が進んでいる領域への理解
何を入力し、何を出力するか。→何を学習し、何を最適化するか。

改正著作権法
論文や写真などの著作物を、ディープラーニングなどの学習に使用したい場合は、その著作権者の許諾が必要です。
  • 例外規定→著作権法30条の4

知的財産法
学習済みデータ
作成したデータ
知的財産
学習済みモデル
AIが生み出した作品
議論中

管理人/副管理人のみ編集できます