はじめに
幽灯子/基本情報技術者副専門官「マルチメディア」という言葉、日常でもよく耳にしますよね。でも、基本情報技術者試験に出てくるマルチメディア技術は、ちょっと専門的な内容が含まれています。この記事では、「試験に出るマルチメディア技術」を、難しい用語もできるだけ噛み砕いて、一般の方にもわかりやすく解説します。
そもそも「マルチメディア」って何?





「マルチ(多数の)」+「メディア(媒体)」という言葉の通り、文字・音声・画像・動画・アニメーションなど、複数の種類の情報を組み合わせて表現する技術のことをマルチメディアといいます。
たとえば、YouTubeの動画は「映像+音声+テキスト字幕」が組み合わさっており、まさにマルチメディアの代表例です。スマートフォンのゲームアプリも、グラフィック・BGM・効果音・テキストが融合したマルチメディアコンテンツといえます。
試験で問われる主なテーマ



基本情報技術者試験では、マルチメディアに関してざっくり以下のテーマが出題されます。
- 画像・音声・動画のデジタル化の仕組み
- ファイル形式と圧縮技術
- 解像度と色数の計算
- ストリーミングと配信技術
それぞれ順番に見ていきましょう。
① 画像のデジタル化「ラスタとベクタ」



デジタル画像には大きく2種類あります。
ラスタ(ビットマップ)画像
ラスタ画像は、画像を小さなドット(ピクセル)の集合として表現する方式です。写真のように色の変化が細かい画像に向いています。拡大するとドットが見えてしまう(ギザギザになる)のが特徴で、「ジャギー」と呼ばれます。
代表的なファイル形式:JPEG、PNG、GIF、BMPなど
ベクタ(ベクトル)画像
ベクタ画像は、点や線・曲線などの数式データとして画像を記録する方式です。拡大・縮小しても画質が劣化しないため、ロゴやイラストによく使われます。
代表的なファイル形式:SVG、AIなど
② 解像度と色数の計算(試験頻出!)
解像度とは?
解像度とは、画像の細かさを表す指標です。「1インチあたりに何個のドットが並んでいるか」を示す単位で、dpi(dots per inch) が使われます。数値が大きいほど細かく鮮明な画像になります。
なお、試験では「画面解像度」として横×縦のピクセル数(例:640×480ピクセル)が用いられる問題が頻出ですので、データ量計算の際にはこの値を基にしてください。
データ量の計算方法
試験でよく出る問題が「この画像のデータ量は何バイトか?」というもの。計算式はシンプルです。
データ量(ビット) = 横のドット数 × 縦のドット数 × 1ドットあたりのビット数
例題: 横640ピクセル × 縦480ピクセル、フルカラー(24ビット)の画像のデータ量は?
640 × 480 × 24 = 7,372,800 ビット ÷ 8 = 921,600 バイト ≒ 約900KB
色数とビット数
色数とビット数の関係も重要です。
| ビット数 | 表現できる色数 |
|---|---|
| 1ビット | 2色(白と黒) |
| 8ビット | 256色 |
| 16ビット | 65,536色(ハイカラー) |
| 24ビット | 約1,677万色(フルカラー/トゥルーカラー) |
| 32ビット | 約43億色(透明度情報アルファチャンネルを含む) |
③ 音声のデジタル化「標本化・量子化・符号化」





音声は「アナログ信号」ですが、コンピュータで扱うためには「デジタル信号」に変換する必要があります。この変換プロセスは3段階で行われます。
標本化(サンプリング)
連続したアナログ波形を、一定の時間間隔で「切り取る(サンプリングする)」作業です。1秒間に何回サンプリングするかを サンプリング周波数(Hz) といいます。CDの場合は44,100Hz(44.1kHz)が使われており、これは人間が聞こえる音域(最大約20,000Hz)の2倍以上の周波数でサンプリングすることで音を忠実に再現できるという「ナイキストの定理」に基づいています。
量子化
サンプリングで取り出した各時点の音の大きさを、決まった段階数に丸める作業です。段階数は量子化ビット数で決まり、8ビットなら256段階、16ビットなら65,536段階になります。段階数が多いほど元の音に忠実になります。
符号化
量子化したデータを0と1のデジタルデータ(バイナリ)に変換する作業です。この3段階を経て、音声データがコンピュータで扱えるデジタルデータになります。
音声データ量の計算
データ量(ビット) = サンプリング周波数 × 量子化ビット数 × チャンネル数 × 録音時間
例題: サンプリング周波数44.1kHz、16ビット、ステレオ(2チャンネル)で1分間録音した場合のデータ量は?
44,100 × 16 × 2 × 60 = 84,672,000 ビット ÷ 8 ÷ 1,024 ÷ 1,024 ≒ 約10MB
④ 圧縮技術(可逆圧縮と非可逆圧縮)



画像・音声・動画のデータ量はとても大きくなりがちです。そこで活躍するのが「圧縮技術」。試験では 可逆圧縮と非可逆圧縮の違い が必ず問われます。
可逆圧縮(ロスレス圧縮)
圧縮しても元のデータに完全に復元できる圧縮方式です。データを失わないため「ロスレス(損失なし)」ともいいます。文書や医療画像など、データの完全性が重要な場面で使われます。
代表例:PNG、GIF、ZIP、FLAC(音声)
非可逆圧縮(ロッシー圧縮)
人間の目や耳で気づきにくい情報を切り捨てることで高い圧縮率を実現する方式です。一度圧縮すると元のデータには完全に戻せません。写真や音楽など、多少の品質低下が許容できる場面で広く使われます。
代表例:JPEG(画像)、MP3・AAC(音声)、H.264・H.265(動画)
⑤ 主なファイル形式まとめ
画像ファイル形式
| 形式 | 圧縮方式 | 特徴 |
|---|---|---|
| JPEG | 非可逆 | 写真に最適。圧縮率が高い |
| PNG | 可逆 | 透明度(透過)対応。ロゴや図に最適 |
| GIF | 可逆 | 最大256色。アニメーション対応 |
| BMP | 非圧縮 | Windows標準。データ量が大きい |
| TIFF | 可逆/非可逆 | 印刷業界でよく使われる高品質形式 |
音声ファイル形式
| 形式 | 圧縮方式 | 特徴 |
|---|---|---|
| WAV | 非圧縮(または可逆) | CD品質の無圧縮音声 |
| MP3 | 非可逆 | 最も普及した音声圧縮形式 |
| AAC | 非可逆 | MP3より高音質・高圧縮 |
| FLAC | 可逆 | 音楽の高音質保存に人気 |
動画ファイル形式
| 形式 | 特徴 |
|---|---|
| MP4 | 最も普及している動画形式。H.264コーデック使用 |
| AVI | Windows標準の動画形式 |
| MOV | Apple(QuickTime)の動画形式 |
| MKV | 高画質・多機能なオープンソース形式 |
⑥ 動画のデジタル化「コーデックとコンテナ」



動画ファイルを理解するには「コーデック」と「コンテナ」の違いを知ることが重要です。
コーデック(Codec) は、動画・音声データを圧縮・伸張(解凍)するためのアルゴリズムです。「Coder(エンコーダ)」と「Decoder(デコーダ))」を合わせた造語で、H.264・H.265・VP9などが有名です。
コンテナ は、映像・音声・字幕などのデータをひとつのファイルにまとめる「入れ物」です。MP4・AVI・MKVなどがコンテナ形式にあたります。
フレームレート
動画は連続した静止画(フレーム)を高速で切り替えることで動きを表現しています。1秒間に何枚のフレームを表示するかを フレームレート(fps:frames per second) といいます。映画では24fps、テレビでは30fps(日本)が一般的です。
⑦ ストリーミングと配信技術





YouTubeやNetflixで動画を視聴するとき、ファイルを全部ダウンロードしてから見るわけではありませんよね。これが ストリーミング 技術です。
ストリーミングとは、データを受信しながら同時に再生する技術のことです。バッファ(一時保存領域)を使って少しずつデータを受信・蓄積しながら再生することで、巨大なファイルを全部ダウンロードせずにコンテンツを楽しめます。
ストリーミングには大きく2種類あります。
プログレッシブダウンロードはファイルを順番にダウンロードしながら再生する方式で、巻き戻しができます。ライブストリーミングはリアルタイムで配信される方式で、テレビ放送のような即時性が特徴です。
まとめ
基本情報技術者試験のマルチメディア分野は、覚えることが多いように見えますが、「デジタル化の仕組み」「ファイル形式の特徴」「データ量の計算」という3つの柱を押さえれば、効率よく得点できます。



特にデータ量の計算は毎回のように出題される頻出テーマです。公式を丸暗記するのではなく、「なぜそうなるのか」を理解したうえで練習問題を繰り返すことが、確実な得点につながります。














コメント