第6部 標準化について

知る・学ぶテレビ会議のしくみ
この記事は約10分で読めます。

その4. その他 ~音声・映像符号化

*このコンテンツには連載当時(2004年)のままの情報が含まれます。ご注意ください。

IPネットワーク用勧告H.323とISDN用勧告のH.320の関係を整理した曽我蔵くん。しかし、音声・映像符号化方式については、まだ理解が足りないようだ。
ついつい市川さんに頼ってしまう自分を反省しながら、学べる機会は逃さす食らいつく精神がすっかり身についてしまった。

曽我蔵くん

H.323/H.320と音声・映像符号化の関係

市川さん
市川さん
さっき曽我蔵くんは、曖昧な項目としてG.722、G.722.1、MPEG4 AAC-LDというプロトコルをあげていたけど、それはすべて音声符号化方式だよ
曽我蔵くん
曽我蔵くん
それもやっぱり、ITU-Tの勧告なんですか?
市川さん
市川さん
みんな国際標準だけど、正確に言うとG.722、G.722.1はITU-T勧告、MPEG-4 AAC-LDはISO/IEC標準だよ
曽我蔵くん
曽我蔵くん
へえ。いままでH.323とか“H”がつくものばかりだったので、“G”だとかMPEG4 AAC-LDとか、まったく表示の違うものが出てくると不思議に感じます
市川さん
市川さん
プロトコルの説明をしたときに、H.323やH.320は1つのプロトコルではなくて、それぞれのネットワーク上でテレビ会議通信の音声や動画を送受信するために、音声・映像方式・データ圧縮伸長方式などを定めたプロトコルを集めたものだと説明したよね
曽我蔵くん
曽我蔵くん
(慌ててノートをめくって)
はい。確かに
市川さん
市川さん
G.722、G.722.1、MPEG4 AAC-LDなどの音声符号化方法は、H.323やH.320に含まれているものなんだ。映像符号化方法には、H.261やH.263などがある。
つまり、H.323やH.320はシステム全体を定めた標準、G.72xやH.26xはシステムの構成要素を定めた標準というわけだ
曽我蔵くん
曽我蔵くん
……映像符号化は“H”で始まるんですね
市川さん
市川さん
ははは。それで混同してしまう人は多いようだね。
でも映像符号化のH.26xと、H.323やH.320は意味がまったく別のものだから、曽我蔵くんはこの機会にしっかり覚えて欲しい
映像符号化と音声符号化

表記の違いは“圧縮率”と“きれいさ”の違い

曽我蔵くん
曽我蔵くん
G.722やG.722.1、MPEG4 AAC-LDが音声符号化、H.261やH.263が映像符号化で、H.323やH.320に含まれているものだということは分かりましたけど、数字や表記によって何の違いがあるですか?
市川さん
市川さん
簡単に言うと、“圧縮率”と“きれいさ”の違いだ
曽我蔵くん
曽我蔵くん
圧縮率ときれいさ?
市川さん
市川さん
そう。G.7xxとか、H.26xの数字が大きくなるにつれて、圧縮率が高くなり、きれいさが増していく。
たとえばG.711の音声品質レベルは、アナログ電話で会話している程度だ。
G.722はAMラジオレベル。アナログ電話で聞く音声よりもクリアだよね。
G.722.1も同じくAMラジオ程度の音声品質レベルなんだけど、G.722よりも圧縮率が高い。
AAC-LDはさらに良くて、CD並みの音声品質レベルといわれている

主な音声符号化方式

標準 プロトコルの内容 成立時期 帯域(kbps) 音声品質レベル
G.711 電話音声のデジタル伝送のために開発され、アナログ伝送だけだった電話網にデジタル伝送が初めて導入された。 以来、電話網の基本速度は64kbps。 1972年 48、56、64 アナログ電話程度
G.728 アナログ電話帯域信号を16kbpsで符号化する。ISDNによるテレビ電話用の音声などに使用する目的で開発された。 1992年 16 アナログ電話程度
G.722 7kHzの広帯域信号を64kbpsで符号化する。7kHz帯域を4kHzを境にして低域と広域に分割し、各帯域信号に対する適応差分符号化を行う。 1988年 48、56、64 AMラジオ程度
G.722.1 7kHzの広帯域信号を32kbpsあるいは24kbpsで符号化。つまり、約半分のビットレートでG.722相当の品質を実現する。 1999年 24、32 AMラジオ程度
MPEG4 AAC-LD MPEG4 AACの低遅延符号化ツール。MP3よりも1.4倍ほど圧縮効率が高く、音質はほぼ同じ。 2000年 128 CD程度
市川さん
市川さん
映像符号化も、数字が大きくなるにつれてどんどん圧縮率が高くなる。圧縮率が高いということは、少ない帯域でより滑らかな画像が見られるということだ
曽我蔵くん
曽我蔵くん
技術が進むにつれて、テレビ会議システムの映像や音声がクリアになってきた理由には、ブロードバンドの普及だけでなく、プロトコルが進化したおかげもあったんですね

主な映像符号化方式

標準 プロトコルの内容 成立時期 帯域
H.261 ISDNに対応したテレビ電話/テレビ会議用のデジタル映像圧縮符号化標準。 1990年 40kbps~2Mbps
H.263 H.261を改良し、アナログ電話網など低ビットレートの回線に対応したテレビ電話/テレビ会議用の映像圧縮符号化標準。 1996年 10kbps~2Mbps
H.263+ H.236の圧縮符号化効率、機能を拡張。 1998年 10kbps~2Mbps
H.264 動画データの圧縮符号化方式の標準の一つ。テレビ会議だけでなく、携帯電話のテレビ電話といった低速・低画質の用途から、ハイビジョンテレビ放送などの大容量・高画質の動画まで幅広い用途に用いられる。ISO(国際標準化機構)によって動画圧縮標準MPEG-4の一部(MPEG-4 Part 10 Advanced Video Coding)としても標準化されているため、一般的には「H.264/MPEG-4 AVC」「H.264/AVC」のように両者の呼称を併記する場合が多い。 2003年 10kbps~240Mbps程度

接続の可否はプロトコルに依存する

曽我蔵くん
曽我蔵くん
それじゃあもしかすると、ゆくゆくは64kbpsの帯域でもきれいな映像と音声でテレビ会議が実現するかもしれませんよね
市川さん
市川さん
その可能性はあるね。
それに加えて、各メーカーが最新のプロトコルに対応していく必要もある
曽我蔵くん
曽我蔵くん
それは、接続する機種が同じプロトコルを持っていなければならないということですか?
市川さん
市川さん
その通り。たとえば、最新機種と最古の機種を接続した場合、どうなると思う?
曽我蔵くん
曽我蔵くん
……繋がらないんでしょうか?
市川さん
市川さん
繋がる場合と繋がらない場合があるというのが正解かな。
最新の機種は新しいプロトコルで接続しに行くから、古い機種との接続はできても、映像がこなかったり、音声がおかしくなってしまうことがあるんだ。
帯域やクオリティに目を瞑って、お互いの持っているプロトコルで繋げれば、映像も一応移るし、音声も聞こえる
曽我蔵くん
曽我蔵くん
要するに、お互いが共通に持っているプロトコルに依存するってことですね
市川さん
市川さん
だから最近の機種は、どの端末にも音声符号化のG.711と、映像符号化のH.261が入ってるんだよ
曽我蔵くん
曽我蔵くん
それが基本のプロトコルになっているということですね。
結局それは、新しいもの同士の方が確実に接続できるということですか?
市川さん
市川さん
まぁ、そういうことになるね。
でもお客様の心理としては、すでにテレビ会議システムをお持ちなら、なるべく既存の資産を活用していきたいと思うよね。そのあたりを把握してアドバイスするのが曽我蔵くんの仕事だ。今後も技術は進歩し続けるから、これからもがんばって勉強していってね

曽我蔵くんは、「まだまだ勉強することはたくさんありそうですね」と呟いて溜息をついた。

【ブレイクタイム】テレビ会議システム運用のワンポイントアドバイス

教育担当の市川です。
連載20回目を迎えた今回で、「テレビ会議のしくみ」はひとまず終了です。
最後に溜息をついていた曽我蔵くんですが、何も知らなかった入社時から比べると、驚くほど成長しています。読者のみなさまはいかがでしょうか?

市川さん

テレビ会議に限らず、技術というものはどんどん進化していきます。だからといって、とにかく現時点での最高スペック・高価格のものを導入すればいいというものでもありません。テレビ会議をうまく運営していくための第一歩は、自分たちが何を必要としているか、どう使っていきたいのか導入前に把握しておくことではないでしょうか。上手にテレビ会議を使いこなして、ビジネスの発展に役立ててください。

よくある質問

  • H.323とは?
  • H.323とは、ITU-T(International Telecommunication Union Telecommunication Standardization Sector)より勧告されている、LANやインターネットなどのIPベースのネットワーク上で、音声、映像、データといったマルチメディア情報をリアルタイムで提供する国際標準規格のことです。H.323はシステム全体を規定した標準で、音声符号化、映像符号化、マルチメディア多重、通信制御など個々のシステム構成要素技術はそれぞれの標準を参照しています。H.323によるサービス例として、テレビ会議やVoIPなどがあります。IPネットワークが普及された今では、販売されているテレビ会議専用機のほとんどはH.323を搭載しています。
  • H.323の特長とは?
  • H.323はIPネットワークで使われるプロトコルです。H.323の特長は4つあります。1.相互接続性を確保することができること 2.ネットワーク構成から独立していること 3.オペレーティングシステム・アプリケーションソフトウェアから独立していること 4.メッセージはバイナリ形式(コンピュータが直接的に処理するために2進数で表現されるデータ)を採用していることです。IPネットワークは “QoS(Quality of Service)非保証型”のネットワークです。QoS非保証型のIPネットワーク上で音声・映像・データをどのようにリアルタイム通信するかについて、ITU-Tが承認・勧告したものがH.323なので、H.323に準拠しているシステムであれば、H.323が用意しているプロトコルの働きでリアルタイム通信として許容できる品質が得られます。
  • プロトコルとは?
  • プロトコルとは通信規約を意味します。電気通信の世界では送り側と受け側でメッセージをやり取りしますが、それがうまくゆくためには、いかにメッセージを表現するか、その結果をいかにして通信チャネルに乗せるか、受信した信号からいかにして元のメッセージに戻すか、制御コマンドを受信したらどのように動作すればよいか、通信チャネル上の雑音などで予期しない事態が発生したらどうするか、など多岐にわたる規則を送信側と受信側で共有することが必要です。これら個々の通信規約をプロトコルと呼びます。テレビ会議システムで使われるプロトコルは、H.323やH.320があり、H.323はIPネットワーク、H.320はISDNで使われるプロトコルです。テレビ会議のプロトコルの詳細はこちら
  • H.323の機器構成とは?
  • H.323の機器構成を説明します。H.323端末:テレビ会議専用機のほかに、IP電話(VoIP:Voice Over IP)やパソコンのH.323アプリケーションがあります。ゲートウェイ:H.323とH.320の相互接続を実現します。ゲートキーパー:H.323テレビ会議専用の制御や管理します。MUC(Multipoint Control Unit:多地点接続装置)とは3拠点間以上を接続する多地点間テレビ会議を実現するための装置です。その他にHUBやルーターなど、H.323に準拠したIPネットワークを構成する機器があります。
  • H.323とH.320の違いとは?
  • H.320とは、1990年にITU-Tが定めたISDN(ntegrated Services Digital Network)を利用したテレビ会議などの端末の仕様を勧告された規格です。ISDNは電話から発展した技術で、従来のアナログ通信を1と0のデジタル信号に変えて伝送することをISDNと呼びます。インターネットの普及により利用者が減り、NTTは2024年にサービス提供を終了すると発表しています。H.323とH.320の違いを解説します。コスト面は、H.323で利用するIPネットワークは月額固定なのに対し、H.320は使った分だけ通話料金を請求される仕組みの従量課金制です。また、安定性はH.323はベストエフォート型に対し、H.320は接続中は帯域を専有できるメリットがあります。H.323とH.320の違いについてはこちら