ページの先頭です。
このページの本文へ移動します。
テレビ会議のしくみ
テレビ会議のしくみ

第2部テレビ会議システムのしくみその3.円滑なコミュニケーションを行うための技術1

第2部テレビ会議システムのしくみ

その3.円滑なコミュニケーションを行うための技術1

*このコンテンツには連載当時(2004年)のままの情報が含まれます。ご注意ください。

曽我蔵くん

久しぶりに市川さんと会話する機会を得た曽我蔵くんは、次々に浮かぶ疑問をぶつけている。
市川さんによると、「テレビ会議による円滑なコミュニケーションの実現を目指して、さまざまな努力が重ねられている」らしい。
“円滑なコミュニケーションを行うための技術”には、どういうものがあるのだろうか。

テレビ放送の仕組み(地上波)

市川さん
「一番重要なのは遅延対策だね」
曽我蔵くん
「ちえん……ですか?」
市川さん
「そう、遅延。
市川さん
円滑なリアルタイムコミュニケーションを行うには、いかに遅延を少なくするかが鍵なんだ。人間は、0.5秒以上の遅延が発生すると、コミュニケーション中にストレスを感じ始めるんだよ。
テレビの衛星中継でやり取りしている場面を想像すると分かりやすいかな。ニュース番組などで日本のテレビ局と海外とを衛星中継で結んで会話すると、数秒のタイムラグが生じているよね。
曽我蔵くん
「ああ、はい、分かります。スタジオからの呼びかけと相手側の発言がかぶったりしてますね」

そのズレをネタにして腹話術で一人衛星中継をやった芸人がいたなあと、曽我蔵くんは全く関係ないことを思い浮かべた。あれは衛星放送にはタイムラグがあると万人が認識しているということでもあるんだろうな、とも思う。

市川さん
「あまり遅延が大きいと、発言のタイミングが把握できなくてミーティングどころではなくなってしまうよね。だからテレビ会議システムでは、そのタイムラグ――つまり遅延をなるべく抑える努力をしているんだ。
メーカーによって多少の差はあるけれど、遅延はだいたい0.3~0.5秒くらいに抑えられている」
曽我蔵くん
「人がストレスを感じる数値以下に抑えているんですね。
ところで、そもそもなぜ遅延は起こるんですか?」
市川さん
「ひと言で言うと、映像データの処理が重いためだ。 音声データだけなら、電話と同じようにほとんど遅延を感じない速度で処理できるんだけど、映像データはどうしても時間がかかる。だから映像データと音声データを並列に処理すると、そのままでは音声と映像にズレが生じてしまうんだ」
曽我蔵くん
「でも、テレビ会議で相手側と話しているときには、相手側の映像と音声のズレはあまり感じませんよね」
市川さん
「それはリップシンクを行っているからだよ。リップシンクとは、映像データと音声データの同期を取る技術のことをいう。
リップシンクを行っていない場合には、“こんにちは”という声が聞こえてからモニターに映る人物の唇が“こんにちは”と動くことになるけど、リップシンクを行うことで音声の“こんにちは”と唇の“こんにちは”が同期するんだ」
リップシンク

リップシンクあり(上)とリップシンクなし(下)

曽我蔵くん
「つまり“遅延をなるべく抑え”かつ“リップシンク”を行うことで、テレビ会議で自然な会話が交わせるようにしているんですね。
それが“円滑なコミュニケーションのための技術”ということですか」
市川さん
「もちろんそれだけじゃなく、ほかにもいろいろあるよ。たとえば、この“音声追尾カメラ”もその1つだ」
曽我蔵くん
「音声追尾カメラ?」

曽我蔵くんは、市川さんが広げた製品カタログをのぞきこんだ。

発言者を音声検知する音声追尾カメラ

市川さん
「テレビ会議システムは、会議室全体を映したり発言者だけを映したりと、簡単な操作でカメラをコントロールすることができる。出席者全員を映せば、誰が出席しているのかひと目で把握できるね。発言者をクローズすれば、視線や細かい表情まで伝えることができる。
このカメラワークがテレビ会議では重要なんだけど、会議中に発言しながらリモコン操作するのは、意外に煩わしく感じてしまう。かといって、専用オペレーターを置くというのも現実的じゃないよね」
曽我蔵くん
「会議の司会者が操作すればいいんじゃないですか?」
市川さん
「うん。司会進行役がいる場合は、その人が担当することが多いようだね。
だけど、よほど大きな会議でない限り、司会者も参加者の1人として発言することが多いよね。進行案内とカメラ操作を兼務しているうちに、会議に集中できなくってしまうという弊害が起きやすい。だからつい、カメラアングルをほとんど変えないとか、1箇所に固定してしまうようになる。これでは、テレビ会議システムのせっかくの機能を活用できない。
それを解決するのが、音声追尾カメラだ。
音声追尾は、音声で発言者の位置計測を行って、自動的にカメラを動かす機能だ。音声検知で自動的にカメラが上下左右にアングルを変えたり、ズームしたりするので、手動でカメラワークを行う必要がなくなる」
曽我蔵くん
「それは便利ですね!」
音声追尾カメラ

音声を検知してカメラが自動的にアングルを変える

複数の映像を同時に送受信できるH.239

市川さん
「それからもう1つ。複数の映像ソースを送信できるようになったのも“円滑なコミュニケーションのため”と言っていいだろうね。
以前は1つの映像ソースしか送信できなかったんだけど、H.239という規格が標準化されたおかげで、複数の映像を同時に送受信できるようになったんだ」
曽我蔵くん
「ええっと、それはつまり……?」
市川さん
「簡単に言うと、メインカメラが映す“相手の顔”と、“パソコン画面”など資料にあたる映像を同時に見ながら会議ができるんだ。
パソコンの映像だけじゃなく、資料カメラ上に置いた資料や製品とか、ビデオを再生して送ることもできる」
デュアルモニター

相手の姿と資料を同時に送受信して表示する

曽我蔵くん
「ああ! そういえば入社したての頃に、デュアルモニターをそうやって使用すると教えてもらいましたよね!
2台のモニターを並べて、一方に接続先のカメラ映像(人物)を映してもう一方のモニターにはパソコンや資料カメラのデータを映すって」
市川さん
「そう、その通り。パソコン映像などがどういう仕組みで送信されているのかは、また改めて説明するね」

曽我蔵くんは例のごとく、これまでの話をノートにまとめた。

円滑なコミュニケーションのための技術まとめ
  • 遅延を人が違和感を覚える数値以下の0.3~0.5秒以内に抑える
  • リップシンクを行って、音声と映像のズレをなくす
  • 音声追尾カメラで、アングル操作を自動化する
  • 複数の映像を送受信し、「相手の顔」と「資料」のように同時に表示する
曽我蔵くん
「分かりました。大きくはこの4つなんですね」
市川さん
「とんでもない、本当に大事なのはこれからだよ。“円滑なコミュニケーション”に一番重要なのは音声なんだ」

市川さんの楽しそうな様子をみて、曽我蔵くんは内心で「市川さんはもったいぶるのが好きだなあ」としみじみつぶやいた。

1 2 3 4