ビジュアル情報処理-CG・画像処理入門-[改訂新版]
【画像処理エンジニア検定試験のおすすめ問題集・テキスト・参考書】も確認する
【画像処理エンジニア検定のおすすめ勉強法とは?どうすれば独学で合格できる?】も確認する
はじめに
本書は,公益財団法人画像情報教育振興協会(CG-ARTS)が高度情報化社会に相応しい画像情報教育を実現するために,コンピュータグラフィックス(CG)と画像処理の入門レベルのテキストとして2004年4月に出版した書籍『ビジュアル情報処理 -CG・画像処理入門-」の改訂新版である。
本書では,実際にコンピュータを用いて目的の画像を生成・加工する段階で必要となる基本的事項が網羅されている。旧版も,当時のCGと画像処理の技術を総合的に理解させるために周到に準備された標準カリキュラムに基づいて編纂され,両技術のエッセンスをコンパクトにまとめた書籍として,発刊以来多くの読者に利用していただいてきた。
しかし,その間の技術の進展には目を見張るものがあり,最新の状況を極力反映すべく,約13年ぶりに全面的な改訂を試みた次第である。
本書は,9つのchapterとappendixから構成されている。全体は50節・199項に分かれているが,今回新たに40項が加筆・修正された結果,旧版に比べて1chapter・5節・27項増え,頁数も36頁増えている。旧版でも好評であった全ページカラー印刷や読みやすいレイアウトを堅持しながら,傍注や参考図書を一層充実させた。
また,旧版へのご意見やご要望もふまえ,章構成を見直すとともに,全編にわたり,より正確かつわかりやすい記述を心がけた。さらに,図版のリデザインや紹介する最新の事例の吟味にも手間を惜しまなかった。
なお,本書は同協会が実施している検定試験「CGエンジニア検定ベーシック」「画像処理エンジニア検定ベーシック」を受験しようとする学習者のための教科書でもある。同検定は,CG,画像処理分野に対する基礎知識の理解度を測る試験であり,本書による学習と検定試験の受験を通じて,自分自身の知識の習得度を把握し,学習や進学・就職活動に生かしていただければと思う。
本書の改訂にあたり,多忙ななかご協力いただいた編集委員ならびに執筆者の皆様,作品提供・ヒアリング・校正にご協力いただいた皆様,本書をまとめるにあたり,随所で参考にさせていただいた協会発行の既刊書籍の執筆者や編集委員の皆様,長期間献身的に作業を続けてくださった協会の編集担当者の皆様に心より感謝申し上げます。
本書の使い方
右図に示すように,ビジュアル情報がもつ「次元」に注目すれば,ビジュアル情報処理は図中の4本の矢印で示されたものに類型化できる。chapter1では,ディジタルカメラを使った撮影作業や撮影された画像の編集操作を例にして,この枠組みをわかりやすく解説している。このchapterは,ビジュアル情報処理全体を理解するための地図を提供していると考えてほしい。
現実世界にある3次元の物体の形状情報をコンピュータ内に表現し,操作できるようにするしくみはモデリングとよばれる(chapter2)。レンダリングは,モデリングされた情報をディスプレイモニタなどに表示できる2次元の画像に変換する作業を指す(chapter3)。そして対象世界の時間変化をモデリング・レンダリングの両面から扱う技術がアニメーションにほかならない(chapter4)。この3つのchapterがCGのコアである。
一方,ひとたび2次元の画像に変換された情報は,さらに濃淡変換やさまざまなフィルタリング処理を用いて,目的に合わせて加工することができる(chapter5)。また,画像から有益な情報を抽出するための解析手法(chapter6)や,画像から特定のパターンや特徴を検出し,過去の学習結果と照合して,新たな画像を識別するパターン認識手法などが開発され,実世界の各所に応用されている(chapter7)。
さらに,対象世界の3次元情報を−CGの処理の流れとは逆に−対応する画像から復元する作業は高度な内容をともなうものの,その基本的事項については入門レベルでも一通りおさえておきたい(chapter8)。
この4つのchapterが画像処理のコアである。なおchapter5については,高度な画像生成を目指すうえで欠かせない画像処理技術に関する基礎事項であり,CGにも必須の共通領域であることに注意してほしい。
chapter9以降は再びCG・画像処理の両方に共通する事項を扱っている。chapter9からは,最新のビジュアル情報処理の実際を知ることができる。appendixには,重要な関連分野である知覚心理学や,法律知識の基本事項,歴史と応用がまとめられており,効果的な画像生成・処理へ向けたヒントや,制作された映像を他者に発信・共有する際の基本的マナーを学ぶことができる。
以上のような構成から,時間に制約のある場合には,ディジタルカメラモデルを念頭に,各コアと関連するシステム,およびappendixの記述を適宜選択すれば,CGへの入門,あるいは画像処理への入門テキストとして本書を利用することも可能である。しかし全体を読破することによって,両者の関係をきちんと理解することこそが,本書がもつ本来のねらいであることを忘れないでいただきたい。
全編にわたって,なるべく直感的な説明によって両技術のアウトラインを理解してもらえるように本書は執筆されている。学習の便宜を図るために,CG系は青,画像処理系は緑に,双方に必要な部分は水色で色分けされている。一方,互いに密接に関係する説明箇所を明示するポインタ,分野特有の用語や定義の細かな違いを含む補足事項,さらに最も重要な数式は,特注の形式で取り込んでいる。
技術系を目指す人にあっては,入門期においても数式を嫌ってはならない。これらを手がかりとして,背後に広大な数理の世界が拡がっていることを自覚してほしい。そうすることによって,さらに意義のある画像を生成するしくみを自分のものにできるからである。
そのニーズに応えるために,CG-ARTSでは,上級編のテキスト『コンピュータグラフィックスー改訂新版-』,『ディジタル画像処理一改訂新版-』も用意している。読者の皆様が本書の勉強と検定試験の受験を通じて,ビジュアル情報処理のマスターへ向けて,キックオフできることを望んでやまない。
2017年3月
「ビジュアル情報処理 -CG・画像処理入門- 改訂新版」編集委員会
藤代 一成 (CG系編集委員長) 奥富 正敏(画像処理系編集委員長)
目次
1 ディジタルカメラモデル
1-1 ビジュアル情報処理とディジタルカメラモデル
1-1-1 ビジュアル情報処理
1-1-2 ディジタルカメラモデル
1-2 座標系とモデリング
1-2-1 座標系
1-2-2 モデリング
1-3 ビジュアル情報処理の幾何学的モデル
1-3-1 機何学的変換の必要性
1-3-2 2次元図形の基本変換
1-3-3 合成変換とアフィン変換
1-3-4 投影変換
1-3-5 いろいろな座標系と変換
1-3-6 投影図の生成と解釈
1-4 ビジュアル情報処理の光学的モデル
1-4-1 光と色
1-4-2 ビジュアル情報処理の光学的モデル
1-5 ディジタル画像
1-5-1 画像の標本化と量子化
1-5-2 ディジタル画像
1-5-3 いろいろな画像
1-5-4 階調と解像度
1-5-5 ラスタ化による図形の描画
1-5-6 エイリアシングとアンチエイリアシング
1-6 画像処理の分類と役割
1-6-1 画像を加工し出力する処理
1-6-2 画像から情報を抽出する処理
1-6-3 伝送・蓄積のための処理
1-7 補足説明
1-7-1 補足説明/カメラの基礎知識
1-7-2 価足説明/ビジュアル情報処理で用いられる単位
2 モデリング
2-1 形状モデル
2-1-1 ワイヤフレームモデル
2-1-2 サーフェスモデル
2-1-3 ソリッドモデル
2-1-4 形状モデルと表示
2-2 ソリッドモデルの形状表現
2-2-1 CSG表現
2-2-2 境界表現
2-2-3 スイープ表現
2-3 曲線・曲面
2-3-1 曲線の表現形式
2-3-2 2次曲線
2-3-3 パラメトリック曲線
2-3-4 パラメトリック曲面
2-3-5 レンダリングにおける曲面の扱い
補足説明 描画ソフトウェアで用いられる3次ベジェ曲線
2-4 ポリゴン曲面の表現
2-4-1 ポリゴン曲面
2-4-2 細分割曲面
2-4-3 詳細度制御
2-4-4 平滑化処理
2-4-5 パラメータ化
2-4-6 電子透かし
2-4-7 形状検索
2-5 そのほかの形状生成手法
2-5-1 ボクセル
2-5-2 八分木
2-5-3 メタボール
2-5-4 陰関数表現
2-5-5 フラクタル
3 レンダリング
3-1 レンダリングの処理過程
3-1-1 レンダリングを構成する処理
3-2 隠面消去
3-2-1 バックフェースカリング
3-2-2 奥行きソート法
3-2-3 スキャンライン法
3-2-4 Zバッファ法
3-2-5 レイトレーシング法
3-3 シェーディング
3-3-1 シェーディングと影付け
3-3-2 シェーディングの要素
3-3-3 シェーディングモデル
3-3-4 環境光
3-3-5 拡散反射
3-3-6 鏡面反射
3-3-7 完全鏡面反射・透過・屈折
3-3-8 散乱・減衰現象の表示
3-3-9 スムーズシェーディング
3-4 影付け
3-4-1 本影と半影
3-4-2 影の計算法
3-5 マッピング
3-5-1 マッピングの概要
3-5-2 テクスチャマッピング
3-5-3 バンプマッピング
3-5-4 環境マッピング
3-5-5 ソリッドテクスチャリング
3-6 イメージベーストレンダリング
3-6-1 イメージベーストレンダリングの概要
3-6-2 テクスチャマッピングアプローチ
3-6-3 画像再投影アプローチ
3-6-4 パノラマ画像アプローチ
3-6-5 ビューモーフィングアプローチ
3-6-6 レイデータベースアプローチ
3-6-7 イメージベーストライティング
3-7 大域照明計算
3-7-1 ラジオシティ法
3-7-2 フォトンマッピング法
3-8 ボリュームレンダリング
3-8-1 ボリュームビジュアライゼーション
3-8-2 ボリュームレンダリング
3-9 ノンフォトリアリスティックレンダリング
3-9-1 NPRの概要と特徴
3-9-2 2次元画像を入力とするNPR
3-9-3 3次元形状を入力とするNPR
4 アニメーション
4-1 CGアニメーションの構成
4-1-1 アニメーションとは
4-1-2 仮現運動とアニメーションの表現
4-1-3 CGアニメーションに適用される各種アニメーション技法
4-1-4 カメラワーク
4-2 キーフレームアニメーション
4-2-1 キーフレーム法とスケルトン法
4-2-2 キーフレームの補間
4-2-3 形状変形アニメーション
4-3 手続き型アニメーション
4-3-1 進化・成長のアニメーション
4-3-2 自然現象のアニメーション
4-3-3 パーティクルとその応用
4-3-4 AIを利用したアニメーション
4-4 キャラクタのアニメーション
4-4-1 フォワードキネマティクス
4-4-2 インバースキネマティクス
4-4-3 パスアニメーション
4-4-4 モーションキャプチャデータによるアニメーション
4-4-5 筋肉変形アニメーション
4-4-6 表情のアニメーション
4-4-7 布地のアニメーション
4-4-8 髪の毛のアニメーション
4-4-9 群集(フロック)アニメーション
4-5 物理ベースアニメーション
4-5-1 剛体の物理シミュレーション
4-5-2 弾性体の物理シミュレーション
4-5-3 衝突判定
4-6 リアルタイムアニメーションと実写映像との合成
4-6-1 リアルタイムアニメーション
4-6-2 ゲーム物理
4-6-3 実写映像との合成
5 画像の濃淡変換とフィルタリング処理
5-1 画像の性質を表す諸量
5-1-1 ヒストグラム
5-1-2 画像の統計量
5-2 画素ごとの濃淡変換
5-2-1 トーンカーブ
5-2-2 折れ線型のトーンカーブ
5-2-3 ガンマ補正
5-2-4 S字トーンカーブ
5-2-5 ヒストグラム平坦化
5-2-6 濃淡の反転
5-2-7 ポスタリゼーションと2値化
5-2-8 ソラリゼーション
5-2-9 カラー画像の変換
5-2-10 擬似カラー
5-2-11 色相,彩度,明度の変換
5-3 領域に基づく濃淡変換(空間フィルタリング)
5-3-1 空間フィルタリング
5-3-2 平滑化
5-3-3 エッジ抽出
5-3-4 鮮鋭化
補足説明 画像の空間周波数と周波数フィルタリング
5-4 そのほかの処理
5-4-1 画像構成要素の置き換え
5-4-2 画像間演算
5-4-3 マスク処理
6 画像の解析
6-1 2値画像処理
6-1-1 2値化
6-1-2 連結性
6-1-3 輪郭追跡
6-1-4 収縮・膨張処理
6-1-5 形状特徴パラメータ
6-1-6 距離
6-1-7 細線化と特徴点
6-2 領域分割処理
6-2-1 隣接画素の統合による領域分割処理
6-2-2 ミーンシフトによる隣接画素の統合
6-2-3 グラフを用いた領域分割処理
6-2-4 領域分割処理の応用
6-3 動画像処理
6-3-1 移動物体の検出
6-3-2 移動物体の追跡
6-3-3 その他の動画像処理
7 パターン・特徴の検出とパターン認識
7-1 特徴点による画像間のマッチング
7-1-1 特徴点による2つの画像間の対応付け
7-1-2 特徴点検出
7-1-3 スケールと回転に不変な特徴量
7-1-4 対応点探索
7-2 図形の検出
7-2-1 直線の検出
7-2-2 円の検出
7-3 パターンの検出
7-3-1 テンプレートマッチング
7-3-2 相違度の計算
7-4 パターン認識
7-4-1 パターン認識の流れ
7-4-2 画像からの特徴抽出
7-4-3 プロトタイプ法による識別
7-4-4 教師あり学習
7-4-5 教師あり2クラス識別
7-4-6 教師あり多クラス識別
7-5 ニューラルネットと深層学習
7-5-1 ニューラルネットワーク
7-5-2 深層学習とたたみ込みネットワーク
8 シーンの復元
8-1 画像と空間の幾何学的関係と3次元復元
8-1-1 画像上の位置と空間の位置
8-1-2 ステレオビジョン
8-1-3 アクティブステレオ
8-1-4 未知のカメラを用いた3次元復元
8-2 光学的なシーン復元
8-2-1 インバースレンダリング
8-2-2 反射特性
8-2-3 反射成分の分離
8-2-4 形状の復元
8-2-5 反射特性の復元
8-2-6 照明環境の復元
9 ビジュアル情報処理システム
9-1 CGと画像処理の融合
9-1-1 CGにおける画像処理の利用効果
9-1-2 コンピュテーショナルフォトグラフィ
9-2 ビジュアル情報処理用システム
9-2-1 システムの応用
9-2-2 ビジュアル情報処理システムの構成
9-2-3 コンピュータネットワーク
9-3 ビジュアル情報処理用ソフトウェア
9-3-1 ソフトウェアの構成
9-3-2 プログラミング言語
9-3-3 ビジュアル情報処理用APIとシェーダプログラミング言語
9-3-4 ビジュアル情報処理用アプリケーションソフトウェア
9-3-5 3次元モデル記述言語・フォーマット
9-4 リアルタイム3次元CGシステム
9-4-1 3次元CGハードウェア上での処理の流れ
9-5 入出力装置
9-5-1 画像入力装置
9-5-2 3次元データ入力装置
9-5-3 2次元画像出力装置
9-5-4 3次元データ出力装置
9-6 画像ファイル形式と記録方式
9-6-1 静止画像ファイル形式
9-6-2 映像信号フォーマット
9-6-3 動画像ファイル形式
9-6-4 文書記述形式
9-6-5 動画像記録メディア
appendix
a-1 知覚
a-1-1 眼の構造と視野
a-1-2 色と光
a-1-3 形の見え
a-1-4 動きの見え
a-1-5 奥行き知覚
a-2 知的財産権と情報セキュリティ
a-2-1 知的財産権の概要
a-2-2 情報セキュリティ
a-3 ビジュアル情報処理の歴史と応用
a-3-1 CGと画像処理技術の発展
a-3-2 ビジュアル情報処理を構成する主要な技術
a-3-3 産業への応用
参考図書
Index