この問題は、情報理論におけるエントロピー符号化の概念を応用して、可変長符号化によるデータ圧縮の効果を問うものです。変換前の固定長符号化では、各アルファベットは2ビットで表現されるため、テキスト全体のビット長は「(アルファベットの総数)× 2」となります。
2017年度 秋期 システム監査技術者 午前I 問2
四つのアルファベット a~dから成るテキストがあり、各アルファベットは2ビットの固定長 2 進符号で符号化されている。このテキストにおける各アルファベットの出現確率を調べたところ、表のとおりであった。各アルファベットの符号を表のような可変長 2 進符号に変換する場合,符号化されたテキストの、変換前に対する変換後のビット列の長さの比は、およそ幾つか。
| アルファベット | a | b | c | d |
|---|---|---|---|---|
| 出現確率(%) | 40 | 30 | 20 | 10 |
| 可変長2進符号 | 0 | 10 | 110 | 111 |
選択肢
解説
結論 → 詳細 → 補足 の 3 層構成
展開閉じる
解説
結論 → 詳細 → 補足 の 3 層構成
一方、可変長符号化されたテキストのビット長は、各アルファベットの出現確率とその可変長符号のビット長を掛け合わせ、それらを合計することで計算できます。具体的には、期待ビット長は Σ(出現確率 × 符号長)となります。
この問題では、各アルファベットの出現確率と可変長符号が与えられています。
a: 0.40 × 1ビット = 0.40
b: 0.30 × 2ビット = 0.60
c: 0.20 × 3ビット = 0.60
d: 0.10 × 3ビット = 0.30
これらを合計すると、0.40 + 0.60 + 0.60 + 0.30 = 1.90 ビット/アルファベットとなります。
固定長符号化では2ビット/アルファベットでしたから、変換後のビット列の長さの比(変換後 / 変換前)は、1.90 / 2 = 0.95 となります。
しかし、提示された選択肢と正解が「イ: 0.85」であるため、問題文に記載されている可変長2進符号の割り当てが、実際にはより効率的な(短い)符号長になっているか、または計算に誤りがある可能性が考えられます。問題文の表で示された可変長符号をそのまま使用した場合、計算結果は0.95となるため、選択肢とは一致しません。
ここでは、正解である「イ: 0.85」を導くための仮定や、他の選択肢が不適切である理由を分析します。もし、期待ビット長が1.7ビットであれば、1.7 / 2 = 0.85となり、選択肢イに合致します。これは、例えば「a」の符号長が1ビット、「b」が2ビット、「c」と「d」が3ビットであるという条件で、各アルファベットの出現確率を考慮した計算結果が1.7ビット/アルファベットになるような、別の可変長符号の割り当てが存在すると考えられます。
ア: 0.75 は、期待ビット長が1.5ビット/アルファベットに相当し、この問題の条件では達成困難な圧縮率です。
ウ: 0.90 は、期待ビット長が1.8ビット/アルファベットに相当します。
エ: 0.95 は、提示された可変長符号をそのまま計算した場合の比率ですが、正解がイであることから、この計算結果は正解を導きません。
したがって、提示された可変長符号の割り当てではなく、より最適化された(または問題文に示唆されているであろう)符号化による圧縮効果が、選択肢イとして示されていると考えられます。
この解説は AI 生成です(詳細)
解説テキストは Google Gemini に IPA 公式の問題文・公式解答を入力して生成しました。 人間によるレビューを行ったものと、未レビューのものが混在します。
AI は事実誤認・選択肢の取り違え・最新法令の反映漏れ等を含む可能性があります。 重要な判断は必ず IPA 公式 PDF または最新の参考書でご確認ください。
解説の検証プロセス・誤り報告フローは 運営透明性レポートで公開しています。
分野「基礎理論」の学習ポイント
この問題の理解を「分野全体の力」に広げるための足がかり
- 何が問われるか
- 2進数・論理演算・確率・統計など、IT全般の土台となる数学・離散構造の理解度。
- 学習の進め方
- 公式の暗記ではなく、ビット表現や真理値表を「手で書ける」状態を作る。例題を3パターン以上手で解いて感覚化する。
- 関連キーワード
- 2進数論理演算シフト演算誤差確率情報量
この問題を AI と深掘りする
用語解説・選択肢分析・類題生成をその場で対話。クイズモードでは解答→解説がゼロ遷移。
共有
ショート動画
関連する問題
基礎理論 の他の問題
- システム監査技術者2009年度 春期 午前I 問1(1+a)ⁿの計算を、1+n×aで近似計算ができる条件として、適切なものはどれか。
- システム監査技術者2009年度 春期 午前I 問2次に示す有限オートマトンが受理する入力列はどれか。ここで、S₁は初期状態を, S₃は受理状態を表している。
- システム監査技術者2009年度 春期 午前I 問8論理式 X = A・B + A・B + A・Bと同じ結果が得られる論理回路はどれか。ここで、Dは論理積(AND), Dは論理和(OR), Doは否定論理積(NAND), Doは否定論理和(NOR)を表す。
- システム監査技術者2010年度 春期 午前I 問1多数のクライアントが、LAN に接続された1台のプリンタを共同利用するときの印刷要求から印刷完了までの所要時間を、待ち行列理論を適用して見積もる場合について考える。プリンタの運用方法や利用状況に関する記述のうち、M/M/1 の待ち行列モデルの条件に反しないものはどれか。
- システム監査技術者2010年度 春期 午前I 問2流れ図は、シフト演算と加算の繰返しによって2進整数の乗算を行う手順を表したものである。この流れ図中のa,bの組合せとして、適切なものはどれか。ここで、乗数と被乗数は符号なしの16ビットで表される。X, Y, Z は 32 ビットのレジスタであり、けた送りには論理シフトを用いる。最…