深層学習教科書 ディープラーニング G検定公式テキスト 第2版
ディープラーニング
G検定第 公式テキスト
第2版
デジタル時代の必携リテラシー
「G検定」の試験対策書!
G検定を主催しているJDLAが執筆・監修!
新シラバスに完全対応!
練習問題を大増量!
一般社団法人日本ディープラーニング協会監修
藤本敬介、松井孝之、松尾豊、松嶋達也、山下隆義 著 巣籠悠輔、瀬谷啓介、徳田有美子、中澤敏明、 猪狩宇司、今井翔太、江間有沙、岡田陽介、工藤郁子
【G検定おすすめテキスト・過去問題集 – 合格への対策への比較ランキング】も確認する
はじめに
ディープラーニング(深層学習)は、2012年ごろから画像認識の分野で注目されて以来、さまざまなイノベーションを生み出し続けてきた。画像認識は今では顔認証や画像診断をはじめ多くの領域で実用化されている。将棋や囲碁でも当たり前に使われるようになり、「評価値」を見ながら将棋を観戦するスタイルは一般的になった。そして2018年ごろから本格化した自然言語処理における活用は、今日現在も大きな飛躍を見せ続けている。
こうした変化はまだ始まったばかりであり、この先にも次々と大きな技術の進展があるだろう。なぜなら、我々の知能が成し遂げているさまざまな機能に比べ、いまのディープラーニングが可能にしていることはごく一部にすぎないからである 。従来から人工知能の分野で研究されてきた、探索や推論、知識処理、身体性、意味理解などが、ディープラーニングの文脈の上で再度描き直され、新しい技術となって我々の実社会に大きな飛躍をもたらすのではないか。
ディープラーニングは 、直訳すると「深い学習」であるが、この「深い」が意味することは大変大きい。深い多層の関数がもたらす表現力は強力である。汎用目的技術(General-Purpose Technology)という言葉があるが、発明や発見が世界全体の経済に影響を与える可能性のある技術のことである。電気、内燃機関、コンピュータ、インターネットなど、古くは農耕や鉄などが該当し、社会を劇的に変化させる可能性を秘めている。あとから歴史を振り返ると、ディープラーニングも、こうした技術のひとつであり、シンプルな原理で大きな社会的・産業的変化をもたらすことになるだろう。
こうした変化を起こし、主導していくには、やらないといけないことはたくさんある。事業の創出、新しい産業の促進、諸制度の整備、人材の育成、教育の充実。10年後、20年後からみたときに、やるべきことをやるべきタイミングでやっておかなければならない。こうした想いから、日本ディープラーニング協会は2017年に設立された。そして、その初期の重要なミッションは、人材の育成であり、誰もが学べるような仕組みの整備であると考え、G検定・E資格を実施し、これまでに累計約3.5万人の合格者を輩出している(2021年3月時点)。
本書は、ディープラーニングとは何か、その概観と動向、それをビジネスに活かすにはどうすれば良いかなどが書かれている。本書が、ディープラーニングを志す人にとって、知識を取り入れ、実践に活かすための役に立てば幸いである。そして、ぜひディープラーニングの試験の勉強に活かしてほしい。今回の第2版は、デジタル時代に生きるすべてのビジネスパーソンに向けて、「ディープラーニングをビジネスに活かすために必要な知識」を中心に加筆・改訂したものである。ひとりひとりの努力が集まって、日本全体に、ディープラーニングの活用の輪が広がり、大きな産業が誕生することを期待している。
一般社団法人 日本ディープラーニング協会
代表理事松尾豐
CONTENTS
はじめに
試験の概要
読者特典のご案内
第1章 人工知能(AI)とは
1-1. 人工知能(AI)とは
1.人工知能の定義
1.1 人工知能とは何か
1.2 人工知能の大まかな分類
1.3 AI効果
1.4 人工知能とロボットの違い
1-2. 人工知能研究の歴史
1.人工知能研究の歴史
1.1 世界初の汎用コンピュータの誕生
1.2 ダートマス会議
1.3 人工知能研究のブームと冬の時代
章末問題
第2章 人工知能をめぐる動向
2-1. 探索・推論
1.探索・推論
1.1 迷路(探索木)
1.2 ハノイの塔
1.3 ロボットの行動計画
1.4 ボードゲーム(オセロ・チェス・将棋・囲碁)
1.5 モンテカルロ法
2-2. 知識表現
1.知識表現
1.1 人工無脳(知識なしでも知性があるように感じる人間心理の不思議)
1.2 知識ベースの構築とエキスパートシステム
1.3 知識獲得のボトルネック(エキスパートシステムの限界)
1.4 意味ネットワーク
1.5 オントロジー(概念体系を記述するための方法論)
1.6 概念間の関係 (is-aとpart-ofの関係)
1.7オントロジーの構築
1.8 ワトソンと東ロボくん
2-3. 機械学習・深層学習
1.機械学習
1.1 データの増加と機械学習
1.2 機械学習と統計的自然言語処理
2.深層学習(ディープラーニング)
2.1 ニューラルネットワーク
2.2 ディープラーニング(深層学習)
2.3 新時代を切り開くディープラーニング
章末問題
第3章 人工知能分野の問題
3-1. 人工知能分野の問題
1.人工知能分野の問題
1.1 トイ・プロブレム(おもちゃの問題)
1.2 フレーム問題
1.3 チューリングテスト(人工知能ができたかどうかを判定する方法)
1.4 強いAIと弱いAI
1.5 シンボルグラウンディング問題(記号接地問題)
1.6 身体性
1.7 知識獲得のボトルネック
1.8 特徴量設計
1.9 シンギュラリティー
章末問題
第4章 機械学習の具体的手法
4-1. 代表的な手法
1.学習の種類
2.代表的な手法(教師あり学習)
2.1 線形回帰
2.2 ロジスティック回帰
2.3 ランダムフォレスト
2.4 ブースティング
2.5 サポートベクターマシン
2.6 ニューラルネットワーク
2.7 自己回帰モデル
3.代表的な手法(教師なし学習)
3.1 階層なしクラスタリング(k-means法)
3.2 階層ありクラスタリング(ウォード法)
3.3 主成分分析
3.4 協調フィルタリング
3.5 トピックモデル
4.代表的な手法(強化学習)
4.1 理論概要
4.2 バンディットアルゴリズム
4.3 マルコフ決定過程モデル
4.4 価値関数
4.5 方策勾配
4-2. モデルの評価
1.データの扱い
2.評価指標
2.1 正解率・適合率・再現率・F値
2.2 ROCAME AUC
2.3 モデルの解釈
2.4 モデルの選択と情報量
章末問題
第5章 ディープラーニングの概要
5-1. ニューラルネットワークとディープラーニング
1.ディープラーニングの基本
1.1 多層パーセプトロン
1.2 ディープラーニングとは
2.既存のニューラルネットワークにおける問題
5-2. ディープラーニングのアプローチ
1.事前学習によるアプローチ
1.1 オートエンコーダ
1.2 積層オートエンコーダ
1.3 ファインチューニング
1.4 深層信念ネットワーク
2.事前学習なしのアプローチ
5-3. ディープラーニングを実現するには
1.CPUとGPU
1.1 CPUとGPU
1.2 GPGPU
2.ディープラーニングのデータ量
5-4. 活性化関数
1.tanh関数
2.ReLU関数
5-5. 学習率の最適化
1.勾配降下法
2.勾配降下法の問題と改善
5-6. 更なるテクニック
1.ドロップアウト
2.早期終了 (early stopping)
3.データの正規化・重みの初期化
4.バッチ正規化
章末問題
第6章 ディープラーニングの手法
6-1. 畳み込みニューラルネットワーク
1.画像データの扱い
2.CNNの基本形
3.畳み込み層
4.プーリング層
5.全結合層
6.データ拡張
7.CNNの発展形
8.転移学習とファインチューニング
6-2. 深層生成モデル
1.生成モデルの考え方
2.変分オートエンコーダ
3.敵対的生成ネットワーク
6-3. 画像認識分野での応用
1.物体識別タスク
2.物体検出タスク
3.セグメンテーションタスク
4.姿勢推定タスク
5.マルチタスク学習
6-4. 音声処理と自然言語処理分野
1.データの扱い方
1.1 時系列データの扱い
1.2 音声データの扱い
1.3 テキストデータの扱い
1.4 単語埋め込み(word embeddina)
2.RNN(リカレントニューラルネットワーク)
2.1 RNNの基本形
2.2 LSTM
2.3 Bidirectional RNN
2.4エンコーダーディコーダ
2.5 Attention
3.トランスフォーマー
3.1 トランスフォーマーの基本形
3.2 Self-Attention (自己注意機構)
4.自然言語処理におけるPre-trained Models
4.1 GPT
4.2 BERT
4.3 Pre-trained Modelの発展
6-5. 深層強化学習
1.深層強化学習の基本的な手法と発展
1.1 DQNとその拡張手法
1.2 その他の発展的な手法
2.深層強化学習とゲームAI
2.1 ボードゲームにおけるゲームAI
2.2 その他のゲームにおけるゲームAI
3.実システム制御への応用
3.1 深層強化学習をロボット制御に応用する際の課題
3.2 課題に対する解決策
6-6. モデルの解釈性の問題とその対応
1.ディープラーニングモデルの解釈性問題
2.Grad-CAM
章末問題
第7章 ディープラーニングの社会実装に向けて
7-1. AIと社会
1.AIのビジネス利活用と法・倫理
2.周辺分野とのつながり
3.本章の構成とねらい
7-2. AIプロジェクトを計画する
1.AIプロジェクト進行の全体像
2.AIプロジェクトの進め方
2.1 AIを適用するべきかを検討する
2.2 AIを適用した場合のプロセスを再設計する
2.3 AIシステムの提供方法を決める
2.4 開発計画を策定する
2.5 プロジェクト体制を構築する
7-3. データを集める
1.データの収集方法および利用条件の確認
2.データの利用条件と制約の確認
3.学習可能なデータを集める
4.データセットの偏りに注意する
5.役割と責任を明確にして外部と連携する
7-4. データを加工・分析・学習させる
1.データを加工する
2.プライバシー等に配慮してデータを加工する
3.開発・学習環境を準備する
4.アルゴリズムを設計・調整する
5.アセスメントによる次フェーズ以降の実施可否を検討する
6.現場でのコンセプト検証(POC)を行う
7-5. 実装・運用・評価する
1.本番環境での実装・運用を行う
2.成果物を知的財産として守る
3.利用者・データ保持者を保護する
4. 「悪用」へのセキュリティ対策を行う
5.予期しない振る舞いへの対処
6.インセンティブを設計し多様な人材を巻き込む
7-6. クライシス・マネジメントをする
1.体制を整備する
2.有事に対応する
3.社会と対話し対応をアピールする
4.指針を作成し議論を継続する 5.プロジェクトの計画に反映する
章末問題
Appendix 事例集 産業への応用
A-1. 製造業領域における応用事例
1.ものづくり
1.1 自動車部品の不良品検知
1.2 液晶パネルの欠陥検出
2.食品の検査
2.1 チーズの包装の検品
3.廃棄物処理
3.1 産業廃棄物の自動分別
A-2. モビリティ領域における応用事例
1.自動運転監視
1.1 自動運転バスの車内監視
A-3. 医療領域における応用事例
1.診断支援
1.1 胃がんを検出する内視鏡画像診断支援
1.2 超音波検査における影の自動検出
1.3 ディープラーニングを利用した脳MRI分野のプログラム医療機器として国内初となる薬事承認取得
事例
2.創薬
2.1 創薬生産性向上
3.ゲノム解析
3.1 遺伝子など非画像データをディープラーニングで扱う取り組み
A-4. 介護領域における応用事例
1.自立共生支援
1.1 “介護コーチング”への応用
2.予防ヘルスケア
2.1 予防ヘルスケア
A-5. インフラ領域における応用事例
1.保守点検
1.1 送電鉄塔点検ドローン
2.運用効率化
2.1 降雨量予測によるダムの運用効率化
3.防災
3.1 地形データからの土砂災害リスクの予測
A-6. サービス・小売・物流領域における応用事例
1.自動車関連サービス領域への適用
1.1 中古車査定 2.類似商品画像検索
2.1 類似商品画像検索
3.不動産分野への適用
3.1 賃貸物件画像分類
4.生活支援ロボットへの取り組み
4.1 全自動お片付けロボットシステム
5.問い合わせ応答
5.1 問い合わせ応答
6.小売領域への適用
6.1 小売店における顧客トラッキング/マーケティング
7.物流領域への適用
7.1 ピッキングシステム
A-7. 農林水産業領域における応用事例
1.農業
1.1 ピンポイントでの農薬散布による低農薬農業の実現
2.畜産業
2.1 豚の鳴き声からの異常検知 3.漁業
3.1 気象データの補完による漁の効率化
A-8. その他領域における応用事例
1.金融・保険領域への適用
1.1 株価予測
1.2 保険証券の自動分析
2.教育領域への適用
2.1 アダプティブラーニング/短時間での学力診断
3.インターネット関連サービス領域への適用
3.1 ストリーミング動画自動翻訳システム
3.2 オークション偽物出品対策
3.3 ゲームバランス調整サポート
4.自然科学領域への適用/研究支援
4.1 試料の位置合わせ
4.2 分析結果の再チェック
5.その他領域への適用
5.1 ディープラーニングを利用した歌声合成
索引
著者紹介
試験の概要
■ JDLA試験とは
ディープラーニングに関する知識を有し、事業活用する人材(ジェネラリスト=G検定)と、ディープラーニングを実装する人材(エンジニア=E資格)の育成を目指すために設けられた検定・資格試験です。
各々に必要な知識やスキルセットを定義し、資格試験を行うとともに、協会が認定した事業者がトレーニングを提供します。日進月歩する技術であることから、検定・資格実施年毎に実施年号を付与しています。
本書は、JDLA試験のうちG検定(ジェネラリスト)を受験する方に向けた対策テキストです。
■G検定とは
G検定の概要は次の通りです。
図表
■試験範囲
G検定の試験範囲は次の通りです。なお、受験する際には最新の詳細シラバスをJDLA公式サイト(https:// www.jdla.org)で確認してください。
人工知能(AI)とは(人工知能の定義)
ここで掲載している情報は、2021年3月現在のものです。受験をする際には、必ず最新情報を確認してください。
一般社団法人 日本ディープラーニング協会 ▶︎https://www.jala.org
■ 日本ディープラーニング協会(JDLA)とは
ディープラーニングに関する資格試験を運営している日本ディープラーニング協会(JDLA) は 、ディープラーニングを中心とする技術による日本の産業競争力の向上を目指し、松尾豊(東京大学教授)を理事長として、2017年6月に設立されました。
ディープラーニングを事業の核とする企業およびディープラーニングに関わる研究や人材育成に注力している有識者が中心となり、産業活用促進、人材育成、公的機関や産業への提言、国際連携、社会との対話など、産業の健全な発展のために必要な活動を行っています。
CDLE(Community of Deep Learning Evangelists)について
JDLAでは、合格者が実際にビジネスの場で活躍することが、ディープラーニングの社会実装につながると考え、試験合格者のみが参加できるコミュニティ “CDLE(シードル)”を運営しています。JDLA事務局からの招待制で運営しているSlackは、合格者同士の情報交換や学び合いの場となっています。
また、JDLA主催の「合格者の会」や全国各地でのCDLEメンバーによるMeet UpやLT会、JDLAの正会員社や有識者も参加する「CDLEハッカソン」や「CDLE勉強会」も実施しています。
読者特典のご案内
本書の読者特典として、Appendixの「事例集」に紹介しきれなかった事例や参考文献などが下記の読者特典サイトに掲載されています。
https://www.shoeisha.co.jp/book/present/9784798165943
画面の指示に従って進めると、アクセスキーの入力を求める画面が表示されます。画面で指定された箇所のアクセスキーを半角英数字で、大文字、小文字を区別して入力してください。
●注意
※会員特典データのダウンロードには、SHOEISHA iD(翔泳社が運営する無料の会員制度)への会員登録が必要です。詳しくは、Webサイト をご覧ください。
※会員特典データに関する権利は著者および株式会社翔泳社が所有しています。許可なく配布したりWebサイトに転載することはできません。
※会員特典データの提供は予告なく終了することがあります。あらかじめご了承ください。
第1章 人工知能(AI)とは
1-1. 人工知能(AI)とは
人工知能のイメージは、人によって大きく異なります。本節では、人工知能の定義に触れ、その理由を探ります。また、大まかな分類、AI効果、ロボットとの違いなどについても学びます。
1.人工知能の定義
1.1 人工知能とは何か
「人工知能(Artificial Intelligence)」という言葉は、1956年にアメリカで開催されたダートマス会議において、著名な人工知能研究者であるジョン・マッカーシーが初めて使った言葉です。この会議以降「人工知能」というものが学術的な研究分野の1つとして認められていったといわれています。
「人工知能」が、推論、認識、判断など、人間と同じ知的な処理能力を持つ機械(情報処理システム)であるという点については、大多数の研究者の意見は一致しているといってよいでしょう 。しかし、「人工知能とは何か」については、専門家の間でも共有されている定義は未だにありません。なぜなら、そもそも「知性」 や「知能」自体の定義がないため、「人間と同じ知的な処理能力」の解釈が、研究者によって異なるからです。
たとえば、「人間と同じ知的な処理能力」を実現するに当たり、人間の右脳と左脳の機能を実現する必要があるのか、また、感情、心、価値観、パーソナリティーなどは人工知能の実現に必要な要素なのか、といったことについて、研究者の数だけ解釈が存在するのです。
京都大学名誉教授の長尾真は「人間の頭脳活動を極限までシミュレートするシステム」と定義し、東京大学教授の松尾豊は「人工的につくられた人間のような知能、ないしはそれをつくる技術」と定義しています。このように専門家の間ですら定義が異なるのです(表1.1)。したがって、同じシステムを指して、それを人 工知能だと主張する人と、それは人工知能とは呼ばないと考える人がいてもおかしくありません。
表1.1 専門家による人工知能の定義
1.2 人工知能の大まかな分類
専門家の間でさえ人工知能の定義が定まっていないのですから、一般人の人工知能に対するイメージはなおさら曖昧です。
人工知能として一般的にイメージしやすいのは、お掃除ロボットや自動運転自動車などのように、自ら考えて行動しているように見えるもの、つまり、周囲の状況によって自動的に振る舞いを変えるものでしょう。人工知能の有名な書籍である『エージェントアプローチ人工知能』(共立出版)でも、周囲の状況(入力)によって行動(出力)を変えるエージェント(プログラム) として人工知能を捉えています。このような視点から人工知能をレベル別に分類したものが以下の4つです(図1.1)。
図1.1 人工知能のレベル別分類
■ レベル1:シンプルな制御プログラム
エアコンの温度調整、洗濯機の水量調整、電気シェーバーの深剃り調整など、あらかじめ単純な振る舞いがハードウェアやソフトウェアで決まっている製品がこのカテゴリに分類されます。これらの製品では、すべての振る舞いがあらかじめ決められており、その通りに動くだけです。これは制御工学やシステム工学と呼ばれる分野で長年培われた技術で、さまざまな製品で古くから利用されています。
■ レベル2:古典的な人工知能 掃除ロボットや診断プログラムなど、探索・推論、知識データを利用することで、状況に応じて極めて複雑な振る舞いをする製品がこのカテゴリに属します。古典的な人工知能ですが、特定の分野で高い有用性を示し、広く実用化されている技術です。ディープラーニングにつながる人工知能の研究は 、もともとこのレベルのものを人工知能として研究するところから始まっています。
■ レベル3:機械学習を取り入れた人工知能
検索エンジンや交通渋滞予測など、非常に多くのサンプルデータをもとに入力と出力の関係を学習した製品がこのカテゴリに属します。このカテゴリは、パターン認識という古くからの研究をベースに発展し、2000年代に入りビッグデータの時代を迎え、ますます進化しています。古典的な人工知能に属している製品も、近年この方式に移行しているものが数多くあります。
■ レベル4:ディープラーニングを取り入れた人工知能
機械学習では、学習対象となるデータの、どのような特徴が学習結果に大きく影響するかを知ることはとても重要です(これを特徴量と呼びます)。たとえば、土地の価格を予想するための学習を行う際には、「土地の広さ」という特徴が重要だとあらかじめ分かっていると、非常に効率よく学習できます。この特徴量と呼ばれる変数を、自動的に学習するサービスや製品がこのカテゴリに属します。画像認識、音声認識、自動翻訳など、従来コンピュータで実現するのは難しいとされてきた分野で応用が進んでいます。また、将棋や囲碁など、非常に難易度の高いゲームでもディープラーニングを応用することで世界トップレベルのプロ棋士を負かすほどの実力に達しています。
1.3 AI効果
人工知能で何か新しいことが実現され、その原理がわかってしまうと、「それは単純な自動化であって知能とは関係ない」と結論付ける人間の心理的な効果をAI効果と呼びます。
多くの人は、人間特有の知能であると思っていたものが機械で実現できてしまうと、「それは知能ではない」と思いたくなるようです。時代とともに「人工知能」のイメージが変化してしまうのも興味深い現象で、この効果により人工知能の貢献は少なく見積もられすぎていると主張するAI研究者もいます。
1.4 人工知能とロボットの違い
人工知能とロボットの研究をほぼ同じものと考えている人は少なくありません。しかし、専門家の間ではこの2つは明確に異なります。簡単にいえば、ロボットの脳に当たる部分が人工知能になります。
脳以外の部分を研究対象としているロボットの研究者は人工知能の研究者ではありませんし、人工知能の研究はロボットの脳だけを対象としているわけではありません(図1.2)。たとえば、将棋や囲碁のようなゲームでは、物理的な身体は必要ありません。つまり、人工知能の研究とは「考える(知的な処理能力)」という「目に見えないもの」を中心に扱っている学問だと考えてよいでしょう。
人工知能研究
図1.2 人工知能とロボット研究
1-2. 人工知能研究の歴史
人工知能の研究は、ブームと冬の時代を繰り返しながら発展してきました。本節では、汎用コンピュータであるエニアック(ENIAC)の誕生以降の人工知能研究の歴史について学びます。
1.人工知能研究の歴史
1.1 世界初の汎用コンピュータの誕生
1946年、アメリカのペンシルバニア大学でエニアック(ENIAC)という17,468本もの真空管を使った巨大な電算機が開発されました。これが世界初の汎用電子式コンピュータとされています(図1.3)。圧倒的な計算力を持つエニアックの誕生は、いずれコンピュータが人間の能力を凌駕するだろうという可能性を見出すきっかけとなりました。
図1.3 エニアック
1.2 ダートマス会議、
人工知能という言葉は、エニアックの誕生からちょうど10年後の1956年にアメリカで開催された ダートマス会議において初めて使われました。ダートマス会議には、マーヴィン・ミンスキー、ジョン・マッカーシー、アレン・ニューウェル、ハーバート・サイモン、クロード・シャノンなど、後に人工知能や情報理論の研究で重要な役割を果たす著名な研究者たちも参加しました( 図1.4)。知的に行動したり、思考したりするコンピュータ・プログラムの実現可能性について議論されました。
図1.4 ダートマス会議に参加した著名人 (https://www.scienceabc.com/innovation/what-is-artificial-intelligence.htmlより引用)
特にニューウェルとサイモンは、世界初の人工知能プログラムといわれるロジック・セオリストをデモンストレーションし、コンピュータを用いて数学の定理を自動的に証明することが実現可能であることを示しました。これはコンピュータが四則演算などの数値計算しかできなかったものであった当時、画期的なことでした。
1.3 人工知能研究のブームと冬の時代
人工知能研究は、これまで「ブーム」と「冬の時代」を何度か繰り返してきています。ここでは、人工知能 の歴史を大まかにたどってみましょう(図1.5 )。
図1.5 人工知能研究の歴史
■ 第1次AIブーム(推論・探索の時代:1950年代後半~1960年代)
コンピュータによる「推論」や「探索」 の研究が進み、特定の問題に対して解を提示できるようになったことがブームの要因です。東西冷戦下のアメリカでは、特に英語-ロシア語の機械翻訳が注目されました。しかし、迷路や数学の定理の証明のような簡単な問題(「トイ・プロブレム(おもちゃの問題)」)は解けても、複雑な現実の問題は解けないことが明らかになった結果、ブームは急速に冷め、1970年代には人工知能研究は 冬の時代を迎えます。
■ 第2次AIブーム(知識の時代:1980年代)
コンピュータに「知識」を入れると賢くなるというアプローチが全盛を迎え、データベースに大量の専門知 識を溜め込んだエキスパートシステムと呼ばれる実用的なシステムがたくさん作られました。日本では、政府によって「第五世代コンピュータ」と名付けられた大型プロジェクトが推進されました。しかし、知識を蓄 積・管理することの大変さが明らかになってくると、1995年ごろからAIは再び冬の時代に突入します。
■ 第3次AIブーム(機械学習・特徴表現学習の時代:2010年~)
ビッグデータと呼ばれる大量のデータを用いることで、人工知能が自ら知識を獲得する機械学習が実用化されました。また、知識を定義する要素(特徴量と呼ばれる対象を認識する際に注目すべき特徴を定量的に表したもの)を人工知能が自ら習得するディープラーニング(深層学習) が登場したことが、ブームの背景にあります。ディープラーニングを用いたチームが画像認識競技で圧勝したことや人間の碁のチャンピオンにディープラーニングを用いた人工知能であるAlphaGoが勝利するなど、象徴的な出来事が重なり、また、人間を超える超知性が誕生する(シンギュラリティー:「3-1 1.9 シンギュラリティー」参照)可能性に対する懸念などが広まったことで、期待値がさらに高くなっています。
大まかに言うと、第1次AIブームは「推論・探索の時代」、第2次AIブームは「知識の時代」、第3次AIブームは「機械学習と特徴表現学習の時代」であると言えるでしょう。ただし、より正確には、この3つは互いに重なり合っています。たとえば、第2次ブームの主役である知識表現も、第3次ブームの主役である機械学習も、本質的な技術の提案は、第1次ブームのときに既に起こっており、逆に、第1次ブームで主役だった推論や検索も、第2次ブームで主役だった知識表現も、今でも重要な研究として継続されています(図1.6)。
図1.6 AIブームの変遷
章末問題
問題1
人工知能の定義は専門家の間ですら異なる。その説明として適切なものを1つ選べ。
1 人工知能は学術的な研究分野の1つとして認められていないから。
2 「人工」の解釈が研究者によって異なるから。
3 「知性」や「知能」の解釈が研究者によって異なるから。
4 人工知能という言葉は、人工知能研究者ジョン・マッカーシーが彼の論文で私的に使った造語だから。
解答 3
解説
人工知能は学術的な研究分野の1つとして認められており、国際学会も頻繁に行われています。「人工」とは「人の手を加えた、自然のままではない」という意味で研究者の間で意見は一致していると考えられます。人工知能という言葉をジョン・マッカーシーが最初に用いたのは、ダートマス会議です。
問題2
人工知能の定義に関する説明として、不適切なものを1つ選べ。
1 人工知能とは何かについては、専門家の間でも共有されている定義は未だにない。
2 「周囲の状況(入力)によって行動(出力)を変えるエージェント」として人工知能をとらえた場合、あらかじめ単純な振る舞いが決まっている製品も人工知能を搭載した製品だといえる。
3 同じシステムを指して、それを人工知能だと主張する人と、それは人工知能ではないと考える人がいてもおかしくない。
4 人間と同じ知的な処理能力を持つ機械(情報処理システム)であれば、誰もがそれを人工知能であると認めることができる。
解答 4
解説
人工知能の定義は専門家の間でも共有されていないため、同じシステムを指して、それを人工知能だと主張する人と、それは人工知能ではないと考える人がいてもおかしくありません。「人間と同じ知的な処理能力を持つ機械(情報処理システム)」という表現を使う時、「人間と同じ知的な処理能力」という部分の解釈が人によって異なる可能性があります。人工知能の有名な書籍である『エージェントアプローチ人工知能』(共立出版)の中では、「周囲の 状況によって行動を変えるエージェント」として人工知能をとらえています。この定義に従えば、探索・推論、知識 データや機械学習を利用しない製品(シンプルな制御機構しか持たない製品)も人工知能を搭載した製品と捉えることができます。 [参照] 1-1 「1.1人工知能とは何か」
問題3
機械学習を取り入れた人工知能に関する説明として、最も適しているものを1つ選べ。
1 パターン認識という古くからの研究をベースにしている 。
2 サンプルデータが少なくても高い精度で入力と出力の関係を学習する。
3 制御工学やシステム工学と呼ばれる分野で培われた技術を利用している 。
4 全ての振る舞いがあらかじめ決められている。
解答 1
解説
機械学習は、非常に多くのデータサンプルを使って学習することで高い精度の学習を達成することができます。あらかじめ単純な振る舞いがハードウェアやソフトウェアで決まっている製品は、制御工学やシステム工学と呼ばれる分野で長年培われた技術を利用しており、機械学習を利用していません。機械学習は、データが持つ特徴(構造やパターン)を学習するので、パターン認識という古くからの研究をベースにしています 。
問題4
以下の文章において、空欄(ア)(イ)に当てはまる語句の組み合わせとして、最も適しているものを1つ選べ。
ディープラーニングは(ア) に含まれる。ディープラーニングを取り入れた人工知能は、学習対象となるデータの (イ)を自動的に学習する。画像認識、音声認識、自動翻訳など、従来のコンピュータでは実現するのが難しいとされてきた分野での応用が進んでいる。
1 (ア)深層学習 (イ)有用性
2 (ア)機械学習 (イ)有用性
3 (ア)機械学習 (イ)特徴量
4 (ア)深層学習 (イ)特徴量
解答 3
解説
ディープラーニングは日本語では 「深層学習」と呼ばれています。つまり、「ディープラーニング」=「深層学習」 といえますが、ディープラーニングは、機械学習に含まれます(「図1.1 人工知能のレベル別分類」を参照)。
知識を定義する要素(特徴量)を自ら学習するのが、ディープラーニングの特徴です(特徴表現学習するのがディー プラーニングの特徴)。
問題5
以下の文章を読み、空欄(ア) ~ (ウ)に最もよく当てはまる語句の組み合わせを1つ選べ。
1946年にアメリカのペンシルバニア大学で世界初の汎用コンピュータ (ア)が誕生し、その圧倒的な計算力はコンピュータが人間の能力を超えるのだという可能性を見い出すきっかけとなった。人工知能という言葉は、(ア)の誕生からちょうど10年後の1956年にアメリカで開催された(イ)において、著名な人工知能研究者である(ウ) 氏が初めて使った言葉である。
1 (ア)エドバック (イ)ダグラス会議 (ウ)ジョン・マッカーシー
2 (アエドバック (イ)ダグラス会議 (ウ)マービン・ミンスキー
3 (ア)エドバック (イ)ダートマス会議 (ウ)ジョン・マッカーシ
4 (ア)エドバック (イ)ダートマス会議 (ウ)マービン・ミンスキー
5 (ア)エニアック (イ)ダグラス会議 (ウ)ジョン・マッカーシー
6 (ア)エニアック (イ)ダグラス会議 (ウ)マービン・ミンスキー
7 (ア)エニアック (イ)ダートマス会議 (ウ)ジョン・マッカーシー
8 (ア)エニアック (イ)ダートマス会議 (ウ)マービン・ミンスキー
解答 7
解説
世界初の汎用コンピュータはエニアックで、エドバックはその後継機として開発されたコンピュータです。ダートマス会議は、後に人工知能の研究で重要な役割を果たす著名な研究者達が集結した伝説の会議として語り継がれています。
[参照] 1-2 「1 人工知能の歴史」
問題6
1956年にアメリカで開催されたダートマス会議に関する説明として、不適切なものを1つ選べ。
1 アレン・ニーウェルトハーバード・サイモンは、ロジック・セオリストのデモンストレーションを行い、コンピューターを用いて数学の定理を自動的に証明することが実現可能であることを示した。 2 ペンシルバニア大学で開発されたエニアックを用いて世界初の人工知能がデモンストレーションされた。
3 知的に行動したり、思考したりするコンピュータ・プログラムの実現可能性について議論された。 4 情報理論の父と呼ばれるクロード・シャノンも会議に参加していた
解答2
解説
ロジック・セオリストは世界初の人工知能プログラムとされており、情報理論の父と呼ばれるクロード・シャノンも会議に参加しています(図1.4参照)。
エニアックが開発されたのはダートマス会議の10年前です。エニアックは、1955年10月2日、午後11時45分、電源が最終的に遮断され引退しています。
問題7
以下の文章を読み、空欄(ア) ~ (ウ)に最もよく当てはまる語句の組み合わせとして、最も適しているもの を1つ選べ。
第1次AIブーム(推論・探索の時代)が冷めた理由は、迷路やパズルなどの (ア)が解けても複雑な現実の問題が解けないことが明らかになったためである。第2次AIブーム(知識の時代)には、専門家の知識をデータベースに蓄積して利用する(イ)と呼ばれる実用的なシステムがたくさん作られたが、知識を蓄積・管理することの難しさが明らかになるにつれて勢いが衰えた。第3次AIブーム(機械学習・ディープラー ニングの時代)は、(ウ) を用いることで自ら知識を獲得する機械学習が実用化され、特に知識を定義する要素である特徴量を自ら学習するディープラーニングが登場したことがブームのきっかけとなった 。
1 (ア)シンプル・プロブレム (イ)エキスパートシステム (ウ)ビッグデータ
2 (ア)シンプル・プロブレム (イ)エキスパートシステム (ウ)クラウドコンピューティング
3 (ア)シンプル・プロブレム (イ)ナレッジシステム (ウ)ビッグデータ
4 (ア)シンプル・プロブレム (イ)ナレッジシステム (ウ)クラウドコンピューティング
5 (ア)トイ・プロブレム (イ)エキスパートシステム (ウ)ビッグデータ
6 (ア)トイ・プロブレム (イ)エキスパートシステム (ウ)クラウドコンピューティング
7 (ア)トイ・プロブレム (イ)ナレッジシステム (ウ)ビッグデータ
8 (ア)トイ・プロブレム (イ)ナレッジシステム (ウ)クラウドコンピューティング
解答 5
解説
迷路やパズルなどの問題は「おもちゃの問題(トイ・プロブレム)」、専門家の知識をデータベース化して利用する人工知能はエキスパートシステムと呼ばれました。第3次AIブームは、インターネットなどを通して蓄積されたビッグデータを機械学習で利用できるようになったことがブームのきっかけの1つになっています。
[参照] 1-2 「3 人工知能ブームと冬の時代」
問題8
AIブームに関する説明として、不適切なものを1つ選べ。
1 第3次AIブームの主役である機械学習(ニューラルネット)も、本質的な提案は第1次AIブームの時に既に出ていた。
2 第2次AIブームの時に、日本では政府によって「第三世代コンピュータ」と名付けられた大型プロジェクトが推進されていた。
3 第2次AIブームの主役である知識表現は、現在も重要な研究対象になっている。
4 第3次AIブームは「機械学習と特徴表現学習の時代」だといえる。
解答 2
解説
ニューラルネットの元祖は、米国の心理学者フランク・ローゼンブラットが1958年に提案した単純パーセプトロンというニューラルネットワークです(「図1.6 AIブームの変遷」、「2.1 ニューラルネットワーク」参照)。第2 次AIブームの時に、日本で政府によって推進されていたプロジェクトは 「第五世代コンピュータ」です。第1次AIブームの主役である推論・探索、第2次AIブームの主役である知識表現は、共に現在も重要な研究対象になっていま す。第3次AIブームは「機械学習と特徴表現学習の時代」、つまり、機械学習とディープラーニングの時代だと言えます。
問題9
次の文章を読み、空欄に最もよく当てはまるものを1つ選べ。
人工知能で何か新しいことが実現され、その原理が分かってしまうと、「それは知能ではない」と思ってしまう人間心理を( )と呼ぶ。この効果により、人工知能の貢献は少なく見積もられていると主張するAI 研究者もいる。
1 ピグマリオン効果
2 バンドワゴン効果
3 イライザ効果
4 AI効果
解答 4
解説
人工知能で何か新しいことが実現され、その原理が分かってしまうと、「それは単純な自動化であって知能とは関係ない」と結論付ける人間の心理的な傾向を、AI効果と呼びます。
1のピグマリオン効果は教育心理学の用語で、人間は期待された通りの成果を出す傾向を指します。2のバンドワゴ ン効果は行動心理学の用語で、ある選択を支持する人が多ければ多いほど、その選択が正しいと思い込む人が多くなるという傾向を指します。3のイライザ効果とは、人間がコンピュータと対話する時、相手がコンピュータだということを意識的には分かっていても、無意識的にコンピュータの動作が人間と似ていると錯覚する(仮定する)傾向を指します。
[参照] 1-1 「1.3 AI効果」
問題10
人工知能とロボットの研究に関する説明として、不適切なものを1つ選べ。
1 物理的な身体を必要としない将棋や囲碁のようなゲームもロボット研究の重要な研究対象である。
2 脳以外の部分を研究対象としているロボットの研究者は人工知能の研究者ではない。
3 人工知能の研究では「考える(知的な処理能力)」という「目に見えないもの」を中心に扱っている。
4 人工知能の研究はロボットの脳だけを対象にしているわけではない。
解答 1
解説
ロボットの脳に当たる部分は人工知能ですが、脳以外の部分を研究対象としているロボットの研究者は人工知能の研究者ではありません。また、人工知能の研究はロボットの脳だけを対象にしているわけではなく、ロボットの研究と異なり物理的な身体は必要ありません。つまり、人工知能の研究は「考える(知的な処理能力)」という「目に見えないもの」を中心に扱っている学問といえます。
1のように物理的な身体を必要としない将棋や囲碁のようなゲームを重要な研究対象としているのは、ロボット研究ではなく人工知能の研究です。
[参照] 1-1 「1.1 人工知能とロボットとの違い」