メディア
- メディアとは,情報の記録,伝達,保管などに用いられる物や装置のことであり,日本語では,媒体といいます.一般に,電話では音声,手紙では文字や図といったように,メディアによって,取り扱うことができる情報の種類が制限されています.そこで,文字.音声,画像,映像,動画などを扱える媒体をマルチメディアと呼んでいます.このような意味で,コンピュータやインターネットはマルチメディアの代表的存在です.
- 例えば,ホームページは,音楽,画像・動画など様々な種類の情報を使用して作成されています.勿論,そのことによって,見やすい,使い易いホームページを目指すわけですが,そのためには,ユーザビリティを十分考慮してデザインする必要があります.
- コンピュータやインターネットが,当初から,マルチメディアであったわけではありません.当初は,基本的に文字だけを利用できる媒体でした.マルチメディア化した大きな理由は,コンピュータや通信速度の高速化や記憶可能な容量の増加です.そのような意味で,コンピュータ内で音声や画像がどのように表現されているかを知ることは重要です.
- マイクやカメラから音声や画像を取り込み,そのまま利用するだけでしたら,音声や画像の表現方法について知る必要はないかもしれません.しかし,音声を分析しその内容を理解したり,又は,画像を分析しある対象を認識したいような場合は,それらの表現方法を知っていると共に,音声や画像の処理方法についての知識も必要になります.その際,「線形代数」,「微分積分」,「フーリエ解析・ラプラス変換」などの数学的知識も必要になります.また,CG (Computer Graphics)のように,画像を製作する場合においても,単に作成するだけでなく,その原理を知ろうとすれば,「線形代数」などの知識が必要になります.
- 数値や文字の表現方法 数値や文字を表現するためには,以下に示すような大きさが必要です( B はバイト,8 ビット)
- 整数: 1 B,2 B,4 B,8 B
- 浮動小数点数: 4 B,8 B
- 文字: 1 B,2 B
- 文庫本 10 万字 ~ 20 万字(約 200 KB ~ 400 KB )
- 音声の表現方法
- 音声は,本来,空気の粗密波です.そのままでは,遠方へ伝達できませんので右図のような電気信号に変換されます.しかし,このような連続信号を直接コンピュータで扱うことはできません.そこで,音声信号の Δt 時間(サンプリング間隔)毎の値( an,an+1,an+2,・・・ )を 16 ビット( 2 バイト)の数値として表し,それらの値の時系列として音声を表現します.Windows における WAVE 形式のデータ(「~.WAV」,「~.WAVE」などのデータ)がこのような方式で作成されたものです.
- では,どのようなサンプリング間隔でデータを記録すればよいのでしょうか.サンプリング定理によりますと,ある波形が含む最大周波数を f としたとき,1 / 2f 秒より短い間隔で記録すれば,記録されたデータから元の波形を復元できます.人間の最大可聴周波数は 20 kHz ですので,サンプリング間隔を 1 / (2 * 20000) 秒以下にすればよいことになります.実際,CD のサンプリング周波数(サンプリング間隔の逆数)は 44.1 kHz になっています.電話で話すと相手の声が多少変わって聞こえるのは,電話の場合,サンプリング周波数が 8 kHz ですので,元のデータを完全には復元できないことが原因です.
- 40 kHz でサンプリングした場合,1 秒間に 40000 個のデータを記録することになります.各データは 2 バイト( B )で表されていますので,1 秒間に約 80 KB (この場合,キロが 1000 ではなく,1024 ですので「約」になります),1 分間で約 4.8 MB のデータ,ステレオですとこの 2 倍,約 9.6 MB のデータが必要になります.上で述べたように,コンピュータ内では,1 つの数字が 4 又は 8 B,1文字が 1 又は 2 Bで表され,文庫本1冊が 400 字詰め原稿用紙 500 枚( 200000 文字)としたとき,約 400 KB であることを考えると,如何に膨大なデータ量かが分かると思います.このように,WAVE 形式のままでは余りにもデータサイズが大きくなりますので,圧縮して利用する場合も多くあります.例えば,MP3 という圧縮形式では,CD の音質をほぼ維持したまま,1 / 10 程度のサイズまで圧縮可能です.
- 次に示すのは,Windows XP のスタート時に流れるメロディです.WAVE 形式のファイルで,そのサイズは 414 KB です.
- 画像の表現方法
- 画像は,基本的に,点(画素,ピクセル)の集まりとして表現されます.1つの画素は,R(赤),G(緑),及び,B(青)の各強さを各 8 ビット(1 B)の情報として持っています.つまり,1つの画素を表すためには,3 B 必要になります.このような形式で保存された画像をビットマップ形式といい,「~.BMP」のようなファイル名で記述されます.
- ディスプレイの解像度を 1024 × 768 とすると,1画面を表すのに( 1024 × 768 × 3 )B = 2.25 MB 必要になります.このように,画像も大きなデータ量となりますので,JPEG や GIF といった方法で,圧縮して使用する場合が多くなります.
- 動画になると,そのデータ量は更に増加します.動画は,1 秒間に 15 ~ 30 枚の画像を連続して表示することによって作成されます.1 画像の大きさが 2.25 MB であり,1 秒間に 30 枚の画像を表示するとすれば,1 秒間に 67.5 MB,1 分間に 4.05 GB のデータ量となります.
- 例に示すアニメーションでは,1 ~ 10 KB 程度の GIF 形式の図を 8 枚使い,200 ms 毎に表示しています.