特別企画 対談

vol.4 「ITと聴覚心理」

対談トップ

1.サウンドファイルの規格が統一されてない?

2.良い音、良い音楽とは?

3.IT業界オノマトペ集


坂本 今回は、いつもと雰囲気を変えて、池の端藪蕎麦からお送りしたいと思います。

*池の端藪蕎麦『鴨鍋』噺家の間では、この鍋食わずして東京の鍋を語るなと。言われているとか言ないとか。

坂本 よろしくお願いします。

古晒 よろしくお願いします。

坂本 第4回目のゲストは、株式会社アプサ取締役社長古晒貴光さんです。まずは、読者に株式会社アプサのご紹介をお願いします。

古晒 株式会社アプサは、1999年の12月という、世紀末に会社を設立しました。今年で、13年目を迎えます。

坂本 世紀末に設立ですか~!(笑)

古晒 そうなんですよ~(笑)99年は、Windows95が爆発的に普及して一般の方々にも、パソコンが広く行き渡り企業でもITが導入され、インターネットも活用された時代でした。

坂本 そうでした。

古晒 従来のコンピューターは、大型コンピューターのようなもので事務処理をしていたんですが今後は、マルチメディアやインターネットであるとか新しいことをやって行こうという考えのもとに設立されました。

坂本 創業されて13年経ちますが、その考えは今でも変わりなく?

古晒 はい。新しいことにチャレンジして来ましたし今後もチャレンジして行くスピリッツは、なくしたくないですね。あとは、常にお客様視点で世の中を便利にしていくという姿勢で仕事に取り組んでいきたいと思ってます。ITというと,仕事の効率をあげて経費節減だとか、ホームページを作って売上増だとかもちろん、ツールの一つではありますが、メールやWebや携帯電話というものは単なるツールという側面を超えて、私たちの生活様式に変化をもたらしています。ITという存在を通じて生活を豊かにする。生活をより知的にする。楽しみを得るであるとか。社会貢献していきたいと思ってます。

坂本 これから、対談でも触れさせていただきますが読者へどのようなシステムが得意かお教え下さい。

古晒 はい。Web技術を活用した業務システムや携帯電話やスマートフォンを活用したシステムを得意としています。具体的には、携帯電話を用いた営業報告システムや、携帯電話のカメラ機能を用いた店頭管理システムなどを開発した実績があります。後は、あまり他社が取組んでいない技術として、携帯電話などモバイル端末を含めた音声技術を得意としています。補聴器向けのDSPプログラムやMATLABを用いた音声処理も行けます。※DSP(Digital Signal Processor)・・・音声などの信号処理に特化したマイクロプロセッサ(チップ)。携帯電話や補聴器に内蔵されている。※MATLAB・・・数値計算に特化したソフトウェア開発環境。大学等の研究機関で多く使用されている。

坂本 うちは、IT会社さんで音声の技術(処理技術)を持たれているところがなくて、以前は実はすごく困ってました。

古晒 音声、オーディオ・ビジュアルを専門にやられている会社はありますが、一般にIT会社は音の技術は突っ込んでやっていないです。もちろん、オトデザイナーズさんと一緒になって、音声系の処理を学んで来ましたが。

坂本 ありがとうございます。そのように言っていただけると(笑)今日のテーマは「ITと聴覚心理」で、伺っていきたいと思います。その中で、ITにおけるサウンド技術(音の技術)についても伺いたいと思っております。

古晒 はい。

古晒 貴光
株式会社アプサ 取締役社長株式会社
株式会社アプサ ホームページ

****サウンドファイルの規格が統一されてない?**** 

坂本 以前、一緒にお仕事をさせていただいた時に改めて感じたんですが、画像、テキストに比べてサウンドファイルは、規格が統一されていないように感じます。どうですか?

古晒 そうです。あまり統一されていないです。時代と共に規格が変わっているという感じもします。

坂本 時代と共に・・・ですか?

古晒 ファミコン、MIDI、カラオケと移って今は、デジタルサウンドの高音質な物まで。音のデジタル化の変遷が早すぎて音声処理ごとに方式が違うので掴み所がない感じがします。

坂本 動画や画像はどうなんでしょう?

古晒 画像は、それほど変わっていないです。JPEG,BMP、TIFFなどです。規格がそれほど多くありませんから、対応のソフトが入ってれば表示はされます。動画は、厄介ですけどね。

坂本 と言いますと?

古晒 動画の場合は、コーデック (Codec) とファイルのフォーマットですね。そこが混沌としてますね。*コーデック データを圧縮/伸張するプログラム。主に容量の大きいデジタルビデオファイル、デジタルオーディオファイルなどを圧縮/伸張する時に用いられる。*フォーマット ここでは、そのファイルの種類、つまり「ファイル形式」のことを指す。

坂本 具体的に何かありますか?

古晒 動画ファイルをダブルクリックして、画像は表示されるんだけれども音声が流れないという現象が起きたりします。

坂本 動画・・・ありますね。何でですか?

古晒 これは、コーデックが(そのPCに)インストールされていなかったりするんです。今は、スマートフォンが普及してきて昔のパソコンみたいな現象は少なくなりましたけどね。でも、音の世界は、まだ、残ってますね。

坂本 動画や画像は、規格が変わると、ハードメーカーは一斉に合わせようとするけど、サウンド関係は合わせる感じがしないですね。

古晒 携帯電話で、音の再生ファイルは、3GP(規格)で統一されていると思いきや、携帯キャリアや機種によって圧縮形式が違ったりするんです(笑)

坂本 音楽、着うたなんかもそうですか?

古晒 音楽も統一されていないですね。機種の世代やメーカーによって再生できる音声ファイルに違いがあったりします。

坂本 通話の音声は別ですよね?通信規格で決まってますから。

古晒 そうですね。

坂本 基本、ITの世界で音を使うというのは、画像にくらべて必要性が低かった。その辺に、対応が遅れている原因がありそうですね。でも、最近は着うたが広まって良くなったかもしれませんね?

古晒 携帯・スマートフォンのお陰で、サウンドも見直されて来ていると感じてます。パソコンの使いやすさのひとつに“ヒューマンインターフェイス”というのがあります。「利用者が使いやすいように」ってよく言われますが・・・。画面は凝って作ってますが、音で操作に関連付けることは昔は全く無かったですね。昔も今も・・・かな? 会社のパソコンって、ほぼ全員が音量OFF状態ですから(笑)スマートフォンが出てきて、音で操作するというのも出てきましたね。*ヒューマンインターフェース 人間と機械やコンピュータが情報をやり取りするための手段や、そのための装置やソフトウェアなどの総称。

坂本 携帯電話は、昔は通話が出来て、着うたが出来れば良かった。それでも、わりと音の技術は、後回しにされていました。今は、スマートフォンが普及して来ているので楽しみです。今後、音とか、どういう展開が考えられますか?

古晒 やっぱり、CMで見ると音声入力ですかね。声で、「近くの美味しいラーメン屋」で検索! みたいな。「今日は、お蕎麦屋」って言った方がよかったですか?(笑)あとは、カーナビなどでしょうか。今後は、音声技術を取り込んで伸びるのではないでしょうか。やはり、エンターテイメント、消費者に近いところから盛り上がってきますね。

坂本 スマートフォンに限定してお話をさせていただきたいのですが、あの狭い画面の中に、これでもか!というぐらい情報が詰まっているように感じます。(視覚的な情報・広告表示なども含め)疲れませんか?無茶な使い方しているつもりはありませんが、やたらと、肩が懲りますよねぇ。

古晒 字も小さいですしね。

坂本 そうです。

古晒 音声の活用となると、以前、坂本さんに「音は記憶に残りやすい」というお話を伺いました。受験勉強や資格勉強なんかにも利用できそうですね。昔はCDとかカセットでしたけどスマートフォンは、操作もできるので、相乗効果というか、学習効果も上がりそうです。

坂本 視覚だけで訴えかけるよりは、音を利用することにより、操作量が少なく視覚の部分はシンプルにできます。使う人のストレスも少なくてすみますよね。

古晒 坂本さんが、任天堂と開発されたキキトリックって、ゲームとしては聴覚重視ですから、その辺はストレスを感じないんじゃないですか?自分も、あれは、かなりやり込みましたけど(笑)すごく面白くて入りこんでしまうわりには、他のゲームに比べて疲労感が、とても少ないんです。

坂本 測定はしてないですけど、おそらく同じ時間、ゲームをやるんであれば、キキトリックの方が視覚に対するストレスは感じないと思いますね。変に肩も凝らないと思います(笑)あのノリを、スマートフォンにも転用できないか?と思います。そこでネックになるのは、フォーマット、規格の問題ですね。単純に、iPhoneとAndroidでも規格が違いますしね。

古晒 本当は1種類になってくれる方が、開発する方はうれしいですね。

坂本 そりゃ、そうだ!(笑)

古晒 昔は、ハードのスペック(性能、仕様)の問題もあるので処理能力を考えて対応しないと行けませんが、今はある程度スペックがいいのでそこは気にしなくて済みますから。

坂本 でも、アプサさんなら、色々なフォーマットでも対応は出来ますよね?

古晒 お陰さまで(笑) 大丈夫です。

坂本 冒頭でも少しお話しましたが、実は、サウンド関係を熟知している、サウンドを取り扱ってくれるIT企業って、意外と少ないんですよ。

古晒 少ないと思います。

坂本 私どものところでは、「今、お付き合いあるソフト会社さんに、サウンドのソフトを開発したい」って言ったら、「サウンドは勘弁してください」って言われて、対応してくれる会社が見つからず、オトデザイナーズに行き着いたというケースも少なくないんです。アプサさんは、互換がとれないところもノウハウを持ってやっていただけるので、安心してご相談できます。

古晒 はい。ご相談下さい。少しお話が変わってしまいますが、技術者の観点でみると音声処理は、画像や文字情報の処理と比べて神秘的な部分がありますね。

坂本 神秘的!? どんな、ところでしょうか?

坂本 真一
オトデザイナーズ代表取締役 工学博士 「伝わる」技術 著者
2012年任天堂から発売された、Wiiソフト「キキトリック」を共同開発

古晒 自然界で耳にする音、音楽、人の声。(物理的には)ただの音なのに、多様な情報を持っていますね。音楽で感動したり、でっかい音でびっくりしたり。人間の心理に大きな影響を与えています。ただ、コンピューター上の処理では、細かく切っていくと、1と0(ゼロ)の(単なる)羅列になっていく訳です。1と0(ゼロ)の羅列が、人間の心を揺さぶっているって、とても神秘的ですね。

坂本 言ってしまうと、現代の聴覚心理ということになるのかもしれません。昔の聴覚心理は、デジタルではなく、アナログですね。今の世界は、一旦、1と0(ゼロ)の羅列に変えられてしまう。だけど、それを再生すると、ちゃんと聞こえるわけです。それで感動できるんです。ところが一つ間違ってしまうと・・・

古晒 つまり、1箇所でも1と0(ゼロ)の羅列が狂うと・・・

坂本 そう。感動ではなく、とたんに不快になってしまいますね。聴覚の神秘的なところですね。


<