top learning-学習

『人工知能の本』辻井潤一(2016年)を読書。

基礎知識として知っておきたいので、本書を選択。

人工知能(AI)には様々なアルゴリズムや基礎技術がある事が分かる。またそれらを身近で利用している事も分かる。
キーワードで特に重要なのはオントロジー、機械学習、ディープラーニング(深層学習)だろうか。

本書はページ半分が図解だが、後半の応用編は分かりずらい。もう少し詳しい説明や具体例が欲しい。

お勧め度:☆☆(基礎理解には適度の内容)

キーワード:<人工知能はこうして生まれた>アルゴリズム/感性的・直感的な思考、サイバネティクス、ダートマス会議、エキスパートシステム/ニューラルネット、ディープラーニング(深層学習)、<人工知能を体験してみよう>探索木、ダイクストラ法、ヒューリスティック/A*アルゴリズム、DPマッチング、オンライン学習/Q学習、ゲームの理論、パーセプトロン、過学習、人工知能学、<人工知能を支える基礎技術>機械学習、クラスタリング、LISP、ベイジアンネット、系統樹、中心性、サポートベクターマシン、大脳皮質、汎用人工知能、並列計算、マルチエージェント/群知能、<人工知能はどう応用されているか>自然言語処理/機械翻訳、オントロジー、分散表現、テンソル、隠れマルコフモデル(HMM)、アノテーション、Eジャーナリズム、画像認識、サービスシステム、業務知識、ロボット/強化学習、<ディープラーニングは何が凄いのか>自己符号化器、表現学習、評価関数、<人工知能の未解決問題と突破策>フレーム問題、意味論、安全性、計算量理論、汎用人工知能/シンギュラリティ、人工生命、<人工知能が溶け込んだ社会の将来像>インダストリー4.0、自動運転車、医療、金融、教育、米国/日本、人工知能研究センター

<はじめに>
・人工知能の研究の流れは大きく2つあります。1つは「知能」の再現です。人間の思考を解明し、コンピュータで再現します。機械学習/自然言語処理/画像認識などの要素技術があります。
・もう1つは「ビッグデータ」です。大量のデータからパターンや事実を認識する技術です。これはディープラーニングの登場によります。
※基本は2系統か。

<人工知能はこうして生まれた>
○人工知能って何だろう?
・人工知能(Artificial Intelligence)は「コンピュータで人間のように情報処理させる」ですが、厳密な定義はありません。「仮名漢字変換機能」は当たり前になり、人工知能と呼べない時代になりました。

・人工知能の特徴は、①自律性-解き方を自動で学習する、②意味性-異種のデータの質や意味を認識できる、③技巧性-難しい課題の解決法を見つけられる、④適応性-状況に則した答えを見つけられるなどです。※難解。

・30年位前は「迷路を解く」「チェスをする」など記号的・パズル的なものでしたが、今は「入試問題を解く」「写真の説明をする」「人間と会話する」などができるようになりました。

○知能は書き表わせる
・問題を解く手順を「アルゴリズム」と云います。これに最大公約数を求める「ユークリッドの互除法」などがあります。しかし人間はこの「アルゴリズム」ではなく、感性的・直感的に思考しています。幼児でさえ猫の写真を見ると、”猫が写っている”と分かりますが、これは「アルゴリズム」で書き表せません。近年の人工知能は、この”感性的・直感的な思考”が可能になったのです。

○論理的な思考とは計算の一種である
・人間もコンピュータも論理的な思考が得意です。エレベータは「開けボタンが押され、ある階に停止していれば、ドアを開ける」というルールで作動します。
・数学と論理は相性が良く、命題が真なら”1”、偽なら”0”を割り当てる「ブール代数」があります。電気回路も人間の神経の回路も同じ仕組みになっています。

○情報を扱う機械の登場
・人工知能とロボットの研究は表裏一体で進んできました。それはロボットが「自律性」を備えているからです。18世紀「フィードバック」(誤差を自動制御)が実用化されます。20世紀機械が情報を観測し、制御するようになり、機械の情報化が始まります(サイバネティクス)。
※ロジックを組み込んでいるだけで、人工知能ではないと思うけど。

○人工知能の学問分野が確立
・「人工知能」という言葉は、1956年ダートマス大学で開かれた研究集会で生まれました(ダートマス会議)。コンピュータを機械制御以上の思考に使う試みです。
・ニューウェルとサイモンは、定理を証明するプログラム「ロジック・セオリスト」を発表します。これは人口知能プログラムの第1号といわれます。

○現実の問題に挑み始めた人工知能
・60年代人工知能の応用が始まり、70年代知識工学として確立します。特定の分野で答えを出す「エキスパートシステム」が開発されます。
・80年代に入ると「ニューラルネット」が評価され、今の機械学習に繋がります。しかし実用的ではなく、”人工知能の冬の時代”に入ります。

○人工知能の冬の時代
・80年代/90年代は”人工知能の冬の時代”です。人工知能は、①記号化・単純化された問題しか解けない、②計算量が多過ぎて処理できない、と批判されます。今では画像データを簡単に収集できますが、当時はフィルムから起こすなどの困難がありました。

○壁を突き破った技術革新
・2010年代に入ると、”人工知能ブーム”が起きます。写真を見て、何が写っているかを答えるのは楽勝です。囲碁でもプロを圧倒するようになりました。
・技術革新が起きた要因が3つあります。①地道な研究。②インターネットは大量のデータをもたらしました。機械学習には大量のデータが不可欠です。③ネット企業の出現です。グーグル/フェイスブック/アマゾンが人工知能を商業的に利用するようになりました。※GAFAだな。

○人工知能ブームの立役者、ディープラーニング
・”人工知能ブーム”の立役者がディープラーニング(深層学習)です。これは「ニューラルネット」を使った機械学習です。写真を見て、猫だと判定できるようになったのです。これは有効な特徴を見つけ、機械学習できるようになったためです(後述)。

○コラム-人工知能の歩みとこれから
・人工知能の研究には2つの流れがあります。1つは人間の思考を基本とする研究です。これにより入試問題を解いたり囲碁・将棋ができるようになりました。もう1つが「ビッグデータ」です。大量のデータから答えを出す仕組みです。
・後者の方法では、答えの判断方法は不明です。今はその判断方法を説明する人工知能が求められています。これにより、判断方法が全く異なる前者と後者の融合が考えられます。※人間の思考に寄らない後者は面白そうだな。コンピュータにはコンピュータ独自の思考方法があるのか。

<人工知能を体験してみよう>
○探索木に沿って考える
・人工知能でよく利用される技術が「探索木」です。この「探索木」には正解を見つける方法が2つ(深さ優先探索、幅優先探索)あります。「深さ優先探索」は行けるところまで行って、行き止まりになると前の分岐に戻る方法です。「幅優先探索」は1手で行けるところを全て確認し、次に2手で行けるところ全て確認する方法です。

○鉄道路線で一番の近道を探す
・このアルゴリズムに「ダイクストラ法」があります。※手順が解説されているが理解できないので省略。
※自分であれば出発駅から1駅毎の時間を加算していく。目的駅に着いたら、それを最短累計時間に設定する。他の経路も駅を追加(時間を加算)し、最短累計時間を超えた時点で、その経路は終了する。でもこれはロジックだな。人工知能は曖昧なものを判別する機能と思うが。

○ヒューリスティックを使った探索
・A地点からB地点までの最短経路を求める方法を考えます。「探索木」では時間が掛かり過ぎます。
・最短経路R(X)はある性質を持ちます。「A地点から中間地点Xまでの距離」+「中間地点XからB地点までの距離」は、他の経路の「A地点から中間地点Yまでの距離」+「中間地点YからB地点までの距離」より小さいのです。
・中間地点まで計算して、中間地点からB地点までの距離が相当あれば、その経路は探索を止めれます。そこで使用するのが中間地点からB地点までの直線距離です。このある程度正しい”コツ”を「ヒューリスティック」と云い、この探索法を「A*アルゴリズム」と云います。※中間に山や湖があって、行き止まりだと困るな。

○最小値検索で文字列の類似性を見抜く
・「あたらしい」は昔、「あらたしい」と言いました。文字は抜けたり、加わったり変化します。ヒトとサルの遺伝子は似ています。これを比較するアルゴリズムに「DPマッチング」があります。
・「DPマッチング」での文字列の比較のルールを、①同じ場合:3点、②違う場合:-20点、③片方が欠落の場合:-5点とします。文字列”AGGTC”と”AGTTC”を単純に比較すると、-8点(=3点×4-20点)になります。ところが”AGGTxC”と”AGxTTC”として比較すると、8点(=3点×6-5点×2)になります。※なんかインチキ。
※何時の間にか、Web検索で文字列の修正機能が追加された。

○やりながら学ぶオンライン学習
・迷路のように試行錯誤で正解を探索するアルゴリズムが「Q学習」です。自由に探索させ、正解を見つけた場合、その経路の「推奨度」を高めます。これを繰り返し、最適の経路を確定させます。※このアルゴリズムを用いた人工知能は多いのでは。

○対戦的状況での戦略を選ぶゲームの理論
・企業戦略/軍事戦略に利用されるのが「ゲームの理論」です。この理論から「ミニマックス戦略」「しっぺ返し戦略」が生まれました。※「ゲームの理論」は複雑な現実では使えないと思う。

○画素情報から画像認識への初歩
・画像から物体の個数を答えるアルゴリズムに「パーセプトロン」があります。画像から4枡のパターン1(物体)/パターン2(穴)の数を調べ、オイラー数(パターン1-パターン2)を物体の個数とします。※全然個数になっていないけど、大丈夫なの。
※Webの画像検索は凄いよな。

○過学習の罠
・最近、人工知能のソフトウェアが公開されていますが、間違った使い方が多く見られます。
・例えば文字を認識させるのに、自分の筆跡ばかりを学習させると、他人の文字を認識できなくなります。学習モデルが大き過ぎると過学習が起きます。
※これはサンプリング数の過少では。これが過学習なのかな。これは偏重学習か過少学習なのでは。

○コラム-人工知能学の俯瞰図
・人工知能学と云う特定の領域は存在しません。様々な分野の積み重ねです。①母体-脳科学/制御工学/論理学/心理学/哲学など、②基礎理論-ニューラルネット/意味論/オントロジー/探索/プランニング/機械学習エキスパートシステム/自然言語処理など、③実用化-画像認識/音声認識/感情認識/機械翻訳、④飛躍-ゲーム/工場自動化/深層学習/ビッグデータ/生命情報科学/教育支援/自動運転/ロボットなど。※深く理解している分野はない。

<人工知能を支える基礎技術>
○機械学習の3つの方式
・機械学習ではコンピュータ自身が試行錯誤し、アルゴリズムを調整(?)します。その方式は3種類(教師あり学習、強化学習、教師なし学習)あります。
・「教師あり学習」は、入力に対し誤った解を出すと、正解を教える方式です(※幼児方式だな)。「強化学習」は、ホームランを打つロボットのように、打ち方自体ではなく、1球毎に結果を伝えます(※これは学生の試験方式かな)。「教師なし学習」は、何も伝えない方式で、手書き文字の分類などが該当します(※大人方式かな。何時の間にか、漢字変換機能に手書きができた)。

○教師なし学習-クラスタリングと云う知能
・「教師なし学習」に「k平均法」があります。これは複数のものを、k個に分類する方法です。最初、k個の中心となるものを選択します。全てのものをk個のグループに分け、その中心を新しい中心に設定します。さらにグループ分けを行い、これを繰り返します。※これは面白い方法だ。

○人工知能用のプログラム言語
・人工知能用の言語として「LISP」があります。「LISP」は1958年に開発された古い言語ですが、今でも利用されています。「LISP」はデータも手順もリスト形式で扱います。
・1972年に開発された「Prolog」もあります。
※この本の近くには、プログラミングの本もあった。アプリは簡単に作れるのかも。問題は入力データの収集とコンピュータの処理能力かな。

○ベイジアンネットが広げた推論の世界
・「エキスパートシステム」は完成したシステムでしたが、事象が増えると膨大な因果関係が生じます。そこで人間が因果関係が強いと思われるネットワーク(ベイジアンネット)を作り、これを実測データで修正します。これを繰り返す事で、現実的な因果関係のネトワークを完成させます。
※NHKの「AIひろし」は、これをやっていないのでは。最初は見たけど、余りに突拍子な答えが出るので、最近は見ていない。

○類似度を可視化する樹形図
・類似度を表す図に「系統樹」があります。3つのサンプルの場合、Y字の「系統樹」になり、それぞれの枝に相違度が記されます。サンプルが4つになるとH字の「系統樹」になります。この方法で生物学のデータなどを分類できます。※「系統樹」を言葉で説明しにくい。

○ネットワークの最重要要素を見つける中心性
・人工知能が扱うデータは、ネットワークの形をしたものが多くあります。SNSのフォロー/商品の購入/Webや論文の参照などです。ネットワークでは「中心性」が重要です。グーグルが検索で成功したのは、「中心性」の高いページを推薦したからです。
・「中心性」を求めるのに最も基本的なのが「次数中心性」です。Webで云えば、他から多く参照されたページが「次数中心性」が高くなります。※昔、検索サイトのトップに出す方法とかあったな。

○サポートベクターマシン
・犬と猫を判別する場合、多数の犬と猫の体長/体重から平均値を求め、そのどちらに近いかで判別する方法があります。
・最近注目されているのが「サポートベクターマシン」です。これは犬と猫の境界線に近いものだけをピックアップし、境界線を決める方法です。※当然後者の方が正確だろうが、犬と猫の場合は重なり合うのでは。

○人間の知能を司る大脳皮質
・人間の知能を司るのは「大脳皮質」です。これを解明できれば、高い知能を持つロボットが実現できます。「大脳皮質」は大脳の表面2mm程度の組織で、約50の領域(運動野、視覚野など)に分けられ、それぞれ機能が異なります。また他に海馬/偏桃体などの器官と連携しています。
・「大脳皮質」には直径50μの円柱の「ミニコラム」があり、その中に100個の「ニューロン」(神経細胞)があります。「ニューロン」は6階層になっています。

○大脳皮質を模倣した機械学習技術
・大脳皮質を模倣したのが、「ニューラルネットワーク」の「ディープラーニング」(深層学習)です。
・「ニューラルネットワーク」は大脳皮質と同様で、あるニューロンは他のニューロンから信号を受け、別のニューロンへ信号を送ります。以前は性能に問題がありましたが、層を深くしても性能が出せるようになりました。これは「ベイジアンネット」(前述)と云えます。

○脳全体を模倣した汎用人工知能の可能性
・今の人工知能はチェスや画像認識など特定の目的にしか使えません。人間のように幅広い範囲をこなすには、汎用人工知能が必要です。
・汎用人工知能を実現するには、大脳皮質などの機能を再現する必要があります。ところがそれには機械学習/神経科学/認知科学などの幅広い知識が必要ですが、人材が不足しています。また人間の脳(ニューロン100億個、1ニューロン当たり1万個のシナプス、1シナプスで1秒当たり100回演算)を実現するには、スーパーコンピュータ1台が必要です。スーパーコンピュータ1台で1人分の脳を再現しても、コストに合いません。
※スーパーコンピュータ1台で人間1人か。人間は偉大だ。

※コンピュータは入力に対して答えを出せば終わりだが、人間は絶え間なく、フローしているからな。猫を見て、毛の色が気になったり、鳴き声が気になったり、食べ物が気になったり、居場所が気になったり。人間は半永久的に、判断/学習を続けているからな。

○機械学習と並列計算
・人工知能や機械学習で必要なのが並列計算です。機械学習を並列化する方法は、①モデル並列、②データ並列があります。機械学習の多くは行列計算なので、行列計算を並列化する事で可能になります(①モデル並列)。
・②データ並列は、複数の機械学習機を並列で動作させる方法です。これらを学習パラメータを与えるパラメータサーバでコントロールします。

○人工知能と計算機
・人工知能に適した計算機がGPGPU(General Purpose computing on Graphics Processing Units)です。GPGPUは機械学習では普通のCPUに比べ、50~100倍の処理能力があります。NVIDIA/インテル/グーグルなどがGPGPUを開発しています。

○信号のデジタル処理
・信号をデジタルにすると、自由自在に加工できます。デジタル画像データにフィルタを使うと、様々な加工が可能です。

○単純な近隣通信だけで生み出される複雑性
・局所的な活動が、大局的な結果を生み出す現象を「セルオートマトン」(からくり人形)と云います。各機械は自分と左右の3つの機械の状況を見て、自分の状況を変化させます。これはアサリの三角形の模様を作ります(※イマイチ理解できず)。気象の予測はこの仕組みそのものです。

○アリのように群衆が作り出す群知能
・アリ1匹は単純な知能しか持っていませんが、アリの群れはエサを集め、巨大な巣を作ります。これをマルチエージェント/群知能と云います。
・工学でも単純な反射ルールが、複雑な論理演算に勝る場合があります。自動車が正面衝突しそうになった時、論理的に考えていたら衝突します。互いの自動車が反射ルールで除ければ、衝突しません。

○コラム-小中学生からの質問
・Q:人工知能が賢くなると、人間を支配しますか。A:既にコンビニに並んでいる商品は人工知能が選んだ商品です。人工知能に支配されるのも、良いものです。
・Q:人間の仕事がなくなるのでは、A:ミシンが発明された時、裁縫業者はミシンを壊しました。しかし今、ミシンは裁縫業者にとって必需品です。人工知能は人間の仕事の品質を高めるでしょう。
・Q:賢い人工知能が、より賢い人工知能を作るようになるのでは。A:不可能ではないでしょう。また人間も遺伝子操作で、脳をより大きくさせるかもしれません。しかし”賢い”とはなんでしょうか。

※色々なアルゴリズムや基礎技術があるな。しかし多数のアルゴリズムや基礎技術を搭載するマルチ人工知能(汎用人工知能)はないだろうな。

<人工知能はどう応用されているか>
○自然言語処理は人工知能の大きな柱
・古くから人工知能には「機械翻訳」の目標があり、自然言語が研究対象でした。ところが自然言語は曖昧なもので、単語は多義的で、文法も厳格ではありません。その曖昧さを人間は経験で補っているのです。ならば人工知能にも経験を積ませようという事で、翻訳アルゴリズムに機械学習を取り入れ、飛躍的に進歩しました。

・この自然言語処理の発展に、画像認識が深く関係しています。2014年グーグルがネット上にある画像に何が写っているかを、人工知能で判断できるようになりました。曖昧な画像で何に注目すべきかを認識できるようになったのです。
※画像は静止画だけど、文章は長くなると難しいかな。何に注目すべきかが分かっても、それを翻訳に反映させるのも難しそう。

○オントロジーによる概念の明示化
・人工知能に仕事をさせるには、概念を理解させる必要があります。これを「オントロジー」と云います。自動運転では形態(人間、車両)、危険物(飛び出し、方向急変、隠れて見えない)などが存在し、これをツリー構造で表します。
※この例はイマイチだな。UMLにはクラス図/アクティビティ図などがあったな。

○単語の意味をベクトルの形で把握する
・単語「赤ちゃん」には、「生まれたて」「可愛い」「か弱い」などのニュアンスがあります。
・単語の意味を人工知能に分からせる方法に「分散表現」があります。例えば単語「2月」「4月」「梅」「桜」は、「2月」「4月」は月を表し、「梅」「桜」は花の一種です。また「2月」と「梅」や、「4月」と「桜」は一緒に使われます。これを平面に配置すると、四角形に配置され、位置ベクトルの引き算「4月」-「2月」=「桜」-「梅」の関係ができます。「分散表現」により、「意味の計算」が可能になります。
※「意味の計算」の使い方が不明。大体観点は2つだけでなく、他に植物/食べ物など無限にあるけど。

○テンソルで関係性と知識を表現する
・数学/物理学でも使われる「テンソル」と云う用語があります。人工知能では「データの組み合わせと、その頻度」になります。例えば、ある店で「カレーと福神漬けを買う回数が9回」あると、(カレー、福神漬け)=9が「テンソル」に記録されます。これを解析する事で、販売戦略を立てます。※データマイニングかな。

○ノイズがあっても声を聞き取る技術
・音声データにはノイズが入ります。これを除去するのが「隠れマルコフモデル」(HMM)です。
・「高気圧なら晴れ50%、曇り40%、雨10%。低気圧なら晴れ20%、曇り30%、雨50%」から気圧計がなくても、天気から気圧が推定できます。晴れが10日続いたら、高気圧が10日続いたと考えられます。※凄い乱暴な推定。
※音声についても解説されているが、理解できず。

○自然言語処理の技術要素
・今は自然言語処理のためのデータ/ソフトウェアが無料で提供されています。最初の処理はネット上の文書を単語に分け、品詞を確定し、表記の揺れを解決します。その後のアプローチは2通りに分かれます。※目的は機械翻訳?
・1つは、文の主語述語関係の精度を上げるため、人間が注記して人工知能伝えます(アノテーション)。
・もう1つは、文章に出現する単語の回数から、何が書かれているか分析させます(※中心性かな)。例えば「卵」「砂糖」「だし」が書かれていれば、「だし巻き卵」について書かれていると分かります。
※「卵」「砂糖」「だし」→「だし巻き卵」の判断は人が入力しないと、人工知能は持っていないのでは。さらに「だし巻き卵」について書かれていると分かって何の役に立つのか。機械翻訳で多義を解決するのに役立つ?理解できず。

○広がる自然言語処理技術の応用先
・自然言語処理は、機械翻訳が主な利用先ですが、拡大しています。テロリスとはインターネットを利用し、テロ計画を交信しています。「Eジャーナリズム」はSNSを分析し、その信頼性を評価する人工知能です。
・言語はあらゆるデータの内容を文章で表現できます。自然言語処理はその分野でも期待されています。※ニュースの原稿を人工知能が作るとかあったな。文章の要約とか、読書感想文とかもあるかな。

○人工知能は画像をどうやって理解しているか?
・人工知能は画像のデジタル・データから類似のものを探し、何が写っているかを判断します。例えば猫であれば、丸い顔/三角形の耳/細長いヒゲなどの要素から、記憶している画像の中から猫の画像を選択します。※これも探索木で認識かな。
・今後は人間の表情から、感情を読み取る事が期待されています。※既にウソ発見器とか開発されていなかった。

○人工知能とサービスシステム設計
・人工知能の評価は利用者と深く関係します。人工知能が人に及ぼす影響が大きくなり、さらに重要になっています。そのためには「サービスシステム」の設計に、利用者が積極的に参加する必要があります。
・近年、人工知能導入による影響の評価・分析が課題になり、「ELSI」(Ethical,Legal and Social Issues、倫理的・法的・社会的課題)が重要になっています。
※システム設計で利用者を重視するのは当然かな。

○人工知能が運動の質を理解し、健康増進を支援
・介護・医療では健康増進のため運動が重要です。ところが指導員が運動者に動作方法を言葉で説明しても伝わらない場合があります。そこで運動者の動作を人工知能に入力し、適切なアドバイスをできます。

○業務知識を学び、従業員を支援する
・業務の知識は、①宣言的知識、②手続的知識に分けられます(※難解)。②手続的知識は業務プロセスで、人工知能が業務を支援しやすい知識です。「移乗介助」であれば、人工知能は介護職員に「移乗介助」の手順を教える事ができます。また知識を見える形で表現する事(知識表現)は重要です。②手続的知識は「順序指向表現」で表現されます。※例として、褥瘡予防に関する行動の業務フローが記されている。
※マニュアルと指導員がいれば問題ないのでは。わざわざ人工知能にする意味が分からない。

・従業員の能力向上には目的/理由を理解させる事も重要です。これは「目的指向表現」で表現されます。表現された知識を人工知能が理解する事で、実際の業務の遅れや、従業員の教育ができます。※例として、褥瘡予防に関する行動が、探索木で記されている。
※これもわざわざ人工知能にする意味が分からない。現状を取り込むには入力システム(センサなど)が必要になる。

○ロボットの行動規則を試行錯誤で学習する人工知能
・ロボットを適切に行動させるためのプログラムを作成するのは大変です。そこでロボットが試行錯誤し、その評価から適切な行動を学習する「強化学習」が以前から研究されてきました。
・「強化学習」は「行動規範」「ロボット」「環境」の3つの要素で考えます(※オントロジーかな)。まず「ロボット」の状況を確認し、「行動規範」に従って行動します。その評価を「環境」から受けます。この繰り返しで「行動規範」を学習します。
・以前は最初から”大規模な試行錯誤”をさせていましたが、近年は”局所的な試行錯誤”を行わせ、短時間で学習できるようになりました。ボトルのキャップを外すロボットは80回の練習で、器用に外せるようになりました。※このロボットは様々な場所で使えそう。ゴミ処理場のキャップ外し/茶摘み/綿摘みなど。

○コラム-人工知能研究者になるには?
・学ぶ事には2種類あります。1つはある分野を追求する縦型、もう1つは学際性を強めた横型です。人工知能では、計算機科学/哲学/言語学など多分野に及ぶため、横型も求められます。
・また人工知能は「作っていく科学」です。既にあるサービスを組み合わせるなどして、新しい社会を設計していく創造的な学問です。
・これらより幅広い学問に関心を持ち、世の中を観察し、社会を設計していきたいと思う人に向いています。※私だ。冗談。

<ディープラーニングは何が凄いのか>
○ディープラーニングを支える自己符号化器
・ディープラーニングの「ディープ」はニューラルネットの層が深い事を意味します。ニューラルネットは入力されたデータに簡単な計算をして、次の層に渡します。機械学習でこの計算方法を調整していきます。近年は一気に多層を作るのではなく、徐々に層を厚くする方法が取られます。

・入力されたデータに計算を加え、さらに逆の計算を行って元のデータを作る「自己符号化器」があります。これによって「ゴミ」を除去できます(※ゴミを除去すると、元のデータは復元できないと思うが。ゴミも復元するのか?)。この「ゴミ」が除去されたデータを使って強化学習する事で、より高度な学習が可能になりました。これが「ディープラーニング」です。

○ディープラーニングと表現学習
・ディープラーニングの本質は、「表現学習」の飛躍的進歩によります。「表現学習」とは、判定/識別するための目の付け所見つける事です。※ネーミングが変。
・囲碁の場合、「輜重」「厚み」などの専門用語があり、従来の人工知能ではそれを教えていました。ところが今は人工知能が膨大なデータから自動で学習するようになりました。そのためディープラーニングでは、その学習結果を人間に説明する「説明可能性」が要求されています。

○ディープラーニングが変える世界
・ディープラーニングの御利益は「特徴量」(?)を見つけてくれる事です。ディープラーニングでの入出力は、どんな形態のデータでも可能です。例えば「乳牛の動き(動画)/鳴き声(音声)/体温(数値)から、乳の出やすさを予測する」なども可能です。
・したがって様々なデータを収集する事が重要になります。センサを多量に配置し、IoTで収集する事も可能ですが、一企業では大変です。そのためデータを共有する仕組みが必要です。しかし逆に、ある人がネットに投稿すると、「この人は、△△市在住、33歳、□□社勤務」と推定され、倫理問題になる恐れもあります。

○コンピュータが将棋で人に勝つ
・将棋プログラムの思考原理は単純です。30手先まで読み、その中で最悪の点数が最も低い手を選択します(ミニマックス戦略)。
・この点数を「評価関数」と呼び、かつては駒の損得/玉の危険度などから、人が点数を付けていました。しかし最近はプロの棋譜からコンピュータが「機械学習」するようになりました。

○コンピュータが囲碁で人に勝つ
・囲碁も将棋と同様の仕組みですが、「評価関数」を作るのが困難でした。2006年「評価関数」に実際の勝敗を入れる事(モンテカルロ木探索)が可能になり、コンピュータの棋力が格段に向上しました。これを可能にしたのも「深層学習」「機械学習」です。

○芸術を作る人工知能
・音楽/小説などの芸術作品を人工知能に作らせる試みは、古くから行われてきました。今日では大量の芸術作品を入力し、「教師なし学習」でパターンを発見させる研究が行われています。またレンブラントの絵を模倣する「ネクスト・レンブラント」プロジェクトもあります。※他に複数の試みを紹介している。

○コラム-人工知能の研究現場
・2015年産業技術総合研究所に人工知能研究センターが設立されました。
・人工知能を開発する敷居は随分低くなりましたが、データの入手方法/計算機への創意工夫/オントロジーの整備などの課題があります。
・当センターには専任の研究員だけでなく、学生/企業の研究者も参加しています。理論と応用の両方に取り組み、地道な研究を続けています。

<人工知能の未解決問題と突破策>
○人工知能は自身の思考を変えられるか?
・人工知能は自身のアルゴリズムの優劣に無頓着です。「15パズル」(4×4マスで1マス抜けたパズル)は完成できないケースもありますが、人工知能は長い時間を掛けて解決しようとします。「ニムゲーム」(最後のボールを取った方が勝ち)では人工知能にさせなくても、必勝パターンがあります。

○フレーム問題
・近年、自動運転車の研究が進んでいます。これもエレベータ/無人運転鉄道/ロボット台車など、古くから実用化されています。違いは外界の複雑さを、どこまで考慮するかです。何を考慮し、何を考慮しないかを「フレーム問題」と云います。
・フレームを広げ過ぎると、際限なく思考するようになり、狭すぎると雑な判断/行動になります。人間はこれを常識で判断しているのです。

・ロボットに卵を運ばせる例を挙げています。「卵を割らない」をルールに追加すると、ロボットはクラクションを鳴らすと卵は割れないだろうか、雪が掛ると卵は割れないだろうか、などと思考するそうです。※笑う。

○記号と対象物の間の大きなギャップ
・「意味論」とは、言語に対応する意味を考える学問です。これも古くから人工知能で取り組まれています。
・ロボットに「道を通って、買い物してきて」と頼むと、”道”の曖昧さから、判断に困惑します。国道も、建物の中の通路も、エレベータも”道”になります。これを「意味設置問題」(シンボルグラウンディング問題)と云います。
・「水を汲みたいから、コップになる物を持ってきて」と云う依頼は、人間には簡単ですが、ロボットだとスープ皿/バケツなど様々な物体が対象になります。

※人間なら”道”と聞いただけで、交通手段/道の構造/道の交通量/付近の建物/今の時刻/外の天気など様々な背景を考慮できるからな。
※コンピュータの思考は、答えを1つに集約する事だが、人間の思考は、無限に拡散させる事かな。そうじゃなくて、どちらも無限に情報を収集する”学習”と、1つの答えを選択する”解決”からなるのかな。

○人工知能の安全性をどう保証するか
・人命を預かる機械は珍しくありません。心臓ペースメーカー/エレベータ/飛行機、全てそうです。この問題に対しIEC61508などの国際工業規格があります。
・人工知能のリスクは人身事故に限りません。金融取引では、リーマンショックの原因になったように、リスクの高い金融商品を作り出しました。
※他の様々なリスクがリストアップされている。

○計算量の爆発
・世の中には”手に負えない問題”もあります。人工知能でも膨大な時間/メモリを要する場合があります。これを「計算量理論」と云います。※詳細が説明されているが省略。

○汎用人工知能の夢
・人工知能は将棋なら将棋しかできません。そこで汎用人工知能の研究が進められています。赤ちゃんは時間と共に、概念/法則性/技能/言語を身に付けます。「赤ちゃんロボット」を作って、汎用人工知能を作る夢が存在します。
・経験による「機械学習」と対称的なのが、論理的な思考をする「推論」です。IBM「ワトソン」や大学入試問題などを解く人工知能などで実現しつつあります。

・人工知能が人の知性を超える事を「シンギュラリティ」と云います。これは社会に大きな影響を与えます。

○人工知能から人工生命
・人工知能の延長に、ロボットが自分と同じロボットを作る「人工生命」があります。実際にロボットがロボットを作るのは困難ですが、アルゴリズムの最適なパラメータを探索する「遺伝的アルゴリズム」があります。
・コンピュータウイルスやビットコインなどの「ブロックチェーン」も自己増殖と考えられます。

○コラム-人工知能時代の人材・組織論
・人工知能の開発には、「アライアンス」(協業)などのオープンな環境が必要ですが、日本は遅れています。また日本の「組織に所属する」メンタリティーも障害になっています。
・人工知能は応用が重要なので縦割り組織はダメです。製造業/サービス業/医療福祉業界などのエキスパートと人工知能の技術者が連携する必要があります。

<人工知能が溶け込んだ社会の将来像>
○人工知能が変えるものづくり
・「インダストリー4.0」になると各装置にセンサが付き、そこからの多種類の情報を人工知能が分析し、品質/効率が上昇すると思われます。また3Dプリンター/レーザ加工機などにより、大量生産から少量多品種生産に変わり、生産体制自体も変わると考えられます。

○自動運転車は現代の人工知能技術の中心命題
・自動運転車は社会を根本から変えるでしょう。また電気自動車は4輪をそれぞれのモータが動かすようになります。ただし自動運転車を公道で走らせるには、周辺の物体の認識/運転計画/道路交通法/標識など様々な課題があります。※自動運転車は制限時速を守るんだろうな。
※自動運転車の開発は2系統あって、1つはIT企業による完全自動運転、もう一つは自動車企業による運転支援らしい。

○家電と人工知能
・「IoT」になると家電/自動車/工場の機器など、様々な物がインターネットに繋がります。これに人工知能が加わると、様々な物から送られてきた情報を分析する事が可能になります。※様々な利用方法が記されているが省略。

○人工知能が医療を変える
・医学のデータは多種多量で「データ爆発」の状態にあります。遺伝子/タンパク質に関する論文は2600万件あります。これらの論文は個別の反応が書かれているだけで、これらを総合的に理解するためには人工知能が必要になります。
・カルテ/定期健診の結果なども膨大にあります。これらを解析し、ピンポイントの「精密医療」をするには人工知能が必要となります。※既にガンの検知で人口知能の利用があったような。

○人工知能が金融を変える
・金融では既に株式取引などでアルゴリズム(人工知能?)が使われています。より高度なアルゴリズムでは、ニュース/天気予報/ネット上の書込み/為替などの情報も取り込んでいます。ただし「ネット上の書込み」は真贋を見極める必要があります。

○人工知能が教育を変える
・人工知能は教育に大きな影響を与えると思われます。集団教育から個別教育に変わり、生徒毎に教育カリキュラムも変わります。
・課題は質的な評価で、論述の評価です。ただしこれが可能になると、暗記型教育から創作・思考型教育への大転換が可能になります。

○アメリカの人工知能開発戦略
・2016年米国で「人工知能の研究開発国家戦略」が作成されました。これに「深層学習」の論文数で中国に抜かれたと記されました。また長期的な観点では、法整備/データ整備/人材育成が必要と記されました。※中国の人口は、米国の4倍以上だからな。
・また人工知能は各分野での応用が期待されると記されました。製造-効率化、物流-堅牢化、交通-安全/インフラ維持、農業-効率化/ロボット化、マーケティング-効率化/顧客満足、通信-高速化/機械翻訳、科学・工学-論文活用/実験効率化、教育-個人学習、医療-ゲノム分析、司法-高速化、セキュリティ-防犯カメラの知能化、安全-事故防止。

○これからの日本と人工知能
・人工知能の研究開発の規模は3種類あります。①アイデアがあれば小資本でも可能、②ビッグデータ/深層学習など巨大IT企業で可能、③巨大企業でも手に負えない。
・日本の「①小資本」は米国の1/100で、遅れています。「③巨大企業でも手に負えない」には、世界規模で協力する必要があります。既にオープンで開発されたソフトウェアもあります。日本は、そのオープンな技術を土台にしたサービスを作り込み、「ことづくり」で勝負するのが有効です。※急に局所的な話になった。
※日本の強み/弱みなども記されているが省略。

○人工知能が仕事を奪う?既存影響と新規事業
・2016年産業競争力会議は、人工知能/ビッグデータの市場規模(2030年)を30兆円に設定しました。
・電話オペレーター/簿記・会計監査などは人工知能に置き換わるが、教師/デザイナーなど創造性の高い仕事は残るとされます。人工知能により、ガンの認知・識別などの新たな業務が立ち上がるとされます。創薬/バイオなどの新規事業も起こるとされます。

○コラム-産業技術総合研究所・人工知能研究センターについて
・人工知能の研究には、基礎研究/応用研究の両方が必要です。また応用分野の拡大で学際性が強まり、多様な分野の専門家との共同研究が不可欠です。
・当研究センターは2つの事を目指しています。①人工知能と近接分野のトップ研究者との連携の核になる。②研究成果を実世界で応用するため、産業界/学界の連携の核になる。
・実世界は3つの領域を対象としています。①サービス業/医療・介護/交通インフラ、②基礎科学/生命科学・臨床医学/材料科学、③ものづくり/産業用ロボット。※部門かな。
・研究開発体制は3つです。①次世代脳型人工知能/データ・知識融合型人工知能などの大規模目的基礎研究。②観測・データ収集/認識・モデル化・予測などの要素技術を次世代人工知能の中核とするための研究開発。③人間行動モデリング(?)/ベンチマークの構築などの人工知能技術の基礎基盤の研究開発。※実際のプロジェクトかな?

top learning-学習