2006年09月28日

WABIAN in 商店街

 高西研究室で研究・開発されているWABIAN-2が,商店街を歩行する実験を行ったそうだ.
 どんどん実環境で実験する姿勢は見習わなければならない.
 歩行のように,目に見えて,というか物理的なインタラクションがあるものは,なんとなく難しいんだろうなーというのが素人の人にもすぐわかるのだと思いますが,音声対話のように一見知的な記号処理さえできれば実現しそうなものというのはすぐ実現可能だと思われがちなような気がする.
 なんでだろう.赤ちゃんが立って歩くまでに結構苦労したりする様子や,自転車に乗る練習をしたりするのをみな共通の経験として持っているからだろうか.確かにそれに対して(第一)言語を習得する様子に特に苦労する様子は見られないので簡単に感じるのかもしれない.

 話は反れましたが,こちらの高西先生のインタビューもロボット研究者としては必読です.

2006年09月26日

WABOT-HOUSE研究所研究公開@岐阜WABOT-HOUSE研究所

 ROBISUKEを展示しました.
 直前までICSLPのため渡米していたので,準備その他は学生のみなさんにやってもらいました.
 早く(デモで)一問一答の対話を脱却したいです.

2006年09月23日

ICSLP@Pittsburgh

 9/16-21.
 行って来ました.
 自分でも意外なことにアメリカ本土に渡ったのはこれが初めてでした.
 今回,日本から来ている人は少なめなようでした.
 色々と勉強になりました.

2006年09月14日

音響学会@金沢

 9/13,14.
 行って来ました.
 今回は調査です.
 ICSLPに参加するため早めに東京に帰りました.

2006年08月20日

学びの支援フォーラムにROBISUKEを展示

 大学通信が主催する学びの支援フォーラムに,去年同様ROBISUKEの展示を行いました.
 ROBISUKEの,去年との大きな違いは「耳に設置されたマイクで音声を認識する」ことと,「目に設置されたカメラで人の顔を追い,さらに年齢性別推定を行う」ことでした.実際の展示を行うと,色々と次の問題点がわかってくるので,そういう機会として貴重です.

2006年08月03日

ユニラボにROBISUKE展示

 大学(理工学部?)が主に小学生を相手に開催しているユニラボにROBISUKEを展示しました.

2006年07月30日

夏合宿

 毎年恒例の夏合宿に行ってきました.発表した学生の皆さんはご苦労様でした.
 春に続いて軽井沢セミナーハウスでした.ここはバスケットボールができるから個人的には嫌いでは無いです.虫が多いのが難点ですが….先生をはじめ,短パンでサッカーをやっていた人は虫刺されが酷かったようです.

2006年07月24日

松下、東大などと共同で、頑健性を高めた顔認証技術を実証実験

 CNET Japanの記事
 面白い実験をやるようです.

2006年07月23日

研究者自身のコピーロボット「ジェミノイド」公開

Robot Watchの記事
というか,Robot Watchなるものがあるのを今知りました….

2006年07月21日

MIRU2006 画像の認識・理解シンポジウム

 MIRU2006に,修士の学生が二人発表するということで参加してきました.
 画像関係の学会にはあまり足を伸ばしたことが無いのでよい勉強になりました.パターン認識に関する発表が少なかったのが意外でした.発表件数が多く評価も高かったのはビジョン系の研究のようだった印象を受けました.
 さらに意外なことに,板倉先生の講演(音声信号処理の歴史的な話)を聞けたのが思わぬ収穫でした.

2006年07月01日

研究者はエンジニアたるべきか?

 私は理工学部の出身ですが,学科は電気工学科(旧称)で,理学部と工学部に分かれている大学に行っていれば工学部に属するべき学科の出身です.
 私は昔から何か自分でものを作る,ということに興味がありました.ただ,あまり手先が器用じゃない,というか,根気がないというか,作業の進め方に多少ムラがある方なので,工作などの類はあまり得意な方ではありませんでした.しかし,小学校の高学年あたりに初めてPCを触って概念が変わりました.ソフトウェアの開発は,基本的に幾らでもやり直しが効くため,様々なことが試しやすかったからです.それから一貫して20年近くの間コンピュータを使って何らかの開発をずっと行ってきました.
 工学,というのはものを作るための学問の総称と言うことで,学科を選んだ当事はあまり深く考えてませんでしたが,電気工学科を選択したことは間違ってなかったと今は思っています.
 最近疑問に思うことは,研究室に配属されてくる学生を含めて,みな「自分でものを作る」という意欲があるかどうかということです.意欲はあるのかもしれませんが,自分では作れないと考えている人が多いのではないかと思います.大学で作るのはあきらめて,会社に就職してから作ってやろうと考えている人も多いのではないでしょうか.確かに一人(もしくはごく少人数)で作れるもの,というのは規模に限界があります.しかし,一生のうちで,一人でものを作る機会などは他にとうていありません(ベンチャー立ち上げる人とかを除けば).周囲に指導教授,先輩方がいて,意見や指導を貰いながらも自分の好きなことができる,というのは恐らくかなり幸せな状況なのだと思います.(プロジェクトとして進行している研究もあり,必ずしも本当に自分がやりたい研究とは言えない人も中にはいると思いますが…)まあ,そのような点を差し引いたとしても,自分の手で何かを作る,ということにもっと貪欲になっていただきたいと思います.皆さん若いんですから.
 一方で,大学で行うのは基礎研究であり,開発ではないのだから,熟考や調査などを重ねて真理を明らかにすることを志すべきだ,というのは真っ当な意見です.私自身,決して物事の真理を探究することを忘れているわけではありませんが,特に私たちが対象としている音声対話やロボットなどの分野は,関連する分野も多く,基礎的な議論よりもまず応用,というような偏りがあるのも事実です.このような点に留意して研究を進めていく必要はあると感じています.
 説教っぽい文になってしまいましたが,タイトルの質問は特に誰かに向けたものではなく,日頃から疑問に思っていることです.最近,プログラムの実装ばかりやってるものですから….ツールばかり作ってたら開発になってしまうかもしれませんけど,他の人が作れない(思いつかないアイディアの入った)ツールやプログラムの一つや二つ作れずに研究をするっていうのもそれはそれでどうなんだろうという気はします.

2006年03月25日

卒業式

例年どおり,3月25日,早稲田大学の卒業式が行われました.
一昨年は学会,昨年は自分の学位授与と,2年間助手としての役目を果たせなかったので,最後の年になってしまいましたが,情報・ネットワーク専攻の修士学位授与式のお手伝いをさせていただきました.みな,晴れ晴れとしたいい顔をしてたと思います.

自分も今年度で助手を退職して新しい職に就きます.職場は変わらない(模様変えをしてだいぶ席は移動しましたが)ですが.あと二年間でROBISUKEをどこまで完璧な対話システムに成長させられるかが,今後の自分のキャリア的にも重要なファクターになると思います.がんばります.

2006年03月15日

音響学会で発表

 音響学会で発表しました.
 ちょっと時間を超過してしまいましたが,そこそこの出来だったと思います.
 ロビスケの口の動きが気になるという指摘を再びされました.無駄な動きが多いのは事実です.ちょっと真剣に音声合成+リップシンキングやった方がいいかもしれません.

2006年02月21日

人から見た自分の顔、カメラ20台で徹底分析

 花王がなんか面白いことやってます
 これ,顔の研究にも応用できるんじゃないでしょうか….

 こっちも

2006年02月20日

研究結果「メールの意図が正しく伝わる確率は5割」

 WIRED NEWSの記事
 「確率」という言葉が相応しいかどうか分からないが,全ての意図が伝わらないのは確かだろう.興味深いのは,

「書き手が、メッセージに込めた意味合いや感情は明確だと往々にして思うのは、書きながら自分が意図する意味合いを頭の中で『聞いて』いるからだ」と、エプリー助教授は説明する。

ということ.つまりパラ言語情報が必要だといっているのでは無いかということなんだろう.

 感情的な論争が訴訟にまで発展するということが記事中で挙げられているが,

「人々は、本当に信じられないくらい馬鹿げたことを会社の電子メールに書いている」と、フリン氏は語った。

ということからも分かるように,本来事務的な内容だけであれば(今まで印刷された文書でやってきたわけだから)特にメールになったから問題になるということは無いはずなのである.
 対面,電話で一言二言やっている何気ない雑談や冗談話をメールでやり取りする際に入れたりするからこういったことになってくるのではないだろうか.

2006年02月11日

Speech Prosody 2006

Speech Prosody 2006にAcceptされました.ゴールデン・ウィークは東ドイツで過ごします.

2006年02月07日

修士論文審査会

 修士論文審査会があり,会場の準備やタイムキーパーをやらせて貰いました.
 発表したM2の皆さんお疲れ様でした.

2006年02月05日

IEEE Trans. Audio, Speech and Language Processing

 昨日,なにげなく眺めてて気がついたんですが,IEEE Trans. Speech and Audio Processing が2006年から IEEE Trans. Audio, Speech and Language Processingに名称変更されたようです.
 AudioとSpeechの順番が入れ替わって,Languageが追加されているという微妙な展開.言語処理分野で投稿し易いTrans.は無かった様に思えますから,いいことではあると思いますけどね.ちなみに名称変更した初号であるvol.14, no.1には,なんとなく取って付けた感の強い,AT&Tの音声言語理解の論文が載っていました.とりあえず読んでみます.
 

2006年02月04日

2005年度合同研究発表会

 白井・小林・山崎・匂坂・菊池研究室合同発表会がありました。
 発表した人、会場準備した人、お疲れ様でした。

2006年01月28日

AIBO生産終了

 SONYの犬型(ペット型?)ロボットのAIBOが生産終了だそうです
 プロトタイプのときのデモを見て驚いたりしてたのを思い出すと、ちょっと感慨深いものがあります。

2006年01月25日

産総研、声でジュースを頼むと、冷蔵庫から取って来る2足歩行ロボット

 CNET Japan の記事

 以前に日本舞踊(?)を踊ったHRPの後継ですね.こうやって定期的にプレスリリースしているのが素晴らしいです.

人間の生活活動を支援するよう知覚機能と行動機能を拡張したヒューマノイドロボットプラットホームを開発したと発表した。

私も日々,コミュニケーションのプラットフォームとなり得る音声対話システムの開発に勤しんでいるわけですが,これほど知的レベルの高いものになってくると,何がプラットフォームで何がアプリケーションかは曖昧になってきます.(汎用性が無ければプラットフォームでは無いし,かと言って汎用性を上げ過ぎると何も出来なくなる)
 本当の意味で開発者も含めた人間の役に立つロボットや音声対話システムが登場するのはいつの日か.日の目を見ていないだけで実はもうあるのかも?

2006年01月15日

高西淳夫教授 @ W PROJECT - Waseda Links

 かつて私が所属していたサークルWaseda-LinksのW PROJECTという企画で機械学科の高西先生が取り上げられています

「二足歩行ロボットは確かに今、何の役にも立たない。本当に役に立つロボットをつくるなら、二足歩行にこだわる必要は全くない。車輪やキャタピラを使えば良い話なんだ。でも、研究に意味が無いなんて絶対に言わせない。僕は二足歩行ロボットをつくることによって、人間の歩行が解明されると思うんだ。そして人間の歩行が分かれば、義足や車椅子をつくるときに役立つだろ。だから、二足歩行ロボットを研究することには、ちゃんと意味があるんだ」
 加藤の力強い言葉。高西は「この人にずっとついていこう」と再決心した。

 二足歩行への熱いこだわりが分かって素晴らしい。

2006年01月14日

サイエンスZERO

 昨年、Discovery Channel Canadaで放映されたDaily Planet Japan Weekが、「海外から見た日本の科学技術」というお題で放映されました。
 運良く(?)研究室の内容が取り上げられました。
 英語で喋れなかったので、僕(日本語)→Daily Planetのナレーション(英語)→日本語字幕、という妙な状況になってましたが…。
 紹介のされ方自体は、よかったと思いますが、キャストの感想を聞いてみてもインパクトはやはり阪大のアンドロイドの方が大きかったんでしょうね。

2006年01月12日

ケータイナビも声で操作--KDDI、音声認識を使った新サービス

 CNET Japanの記事
 携帯電話での音声認識を用いたサービス.「分散型」音声認識を売りにしている.恐らく特徴量抽出までを携帯電話上で行い,尤度計算はサーバ側で行うということを行っているのだと思われる.


さらに、今回au携帯電話に搭載される声de入力機能では、音声認識時に周辺雑音を測定し高い認識性能を維持、誤認識の可能性がある場合に原因を推定してユーザーに利用方法をアドバイスするといった工夫をしている。

といったところが気になる.
 一度使ってみたいなぁ.

2006年01月10日

VARA@オランダの取材

 VARAというオランダのテレビ局の取材を受けました.
 今回は(相手もネイティブではないし)英語で頑張って受け答えしてましたが,なかなかうまく喋れず,最後は日本語で喋りました.喋れることは喋れるけど,無意味なポーズが多い気がする.

VARA@オランダの取材の続きを読む

2005年12月17日

ホンダの「新型ASIMO」--時速6km、手をつないで一緒に歩くことも可能に

ZDNetの記事

また、ASIMOで培った姿勢制御技術、画像および音声認識技術、衝突予知・回避技術認識などを車の安全技術をはじめさまざまな分野にフィードバックする予定だ。

とあるけど、本文の中では画像処理や音声認識処理の話は出てきてないですね。
面白いことは出来ても、なかなか実用レベルまで到達しない(床の凹凸どころではない不確定性を持つ"人"を相手にしなきゃいけないので難しいのだが…)この分野で、HONDAの技術がどこまで行ってるか非常に興味深い。

2005年11月25日

人工知能学会 第45回 言語・音声理解と対話研究会(SLUD)

 長崎のやすらぎ伊王島というところで開催されたSLUDで発表してきました。
 今回は発表順序が一番最後でした。
 会自体ではMulti Party Dialogue、要するに複数対話を扱う研究のパネルディスカッションがあったりして、盛り上がりを見せてました。その他の発表に関してもデータ収集・分析に関する発表が主で、システムを作って云々という発表は今回は僕だけでした。他に東大の擬人化エージェントの発表もありましたが、COEの総括的な発表で技術的な詳細に関する話は無かったので。
 発表では多少の意見をいただけましたが、自分なりに総合すると、実際にシステムを作る側としては音声合成に関して、音質というよりも、細かい韻律やタイミングの制御ができるようなものが必要なんじゃないかと感じました。

2005年10月28日

PRMU研究会

 先月の音響学会に引き続き,仙台の東北大学で行われたPRMUに参加してきました.
 私が普段お世話になっている研究会に比べると理論的な議論が多かったので,ためになりました.

 次の一手を早く考えないと….

2005年10月21日

情報処理学会 第58回 音声言語情報処理研究会

 第58回音声言語情報処理研究会(SLP)が早稲田大学理工学部で開催されました.
 会場の準備を手伝うと共に,発表の最中はマイク係として右往左往してました.今回は実用化を見据えたパネルディスカッションがありましたが,かなりの盛り上がりを見せて時間を大幅に超過していました.

 実用化の中に,標準化というキーワードが入っている.
確かに標準化は必要で,皆が同じものを作って相互に乗り入れ出来るようにするのは重要である.しかしながら,歴史的な経緯を見てみると,標準化で成功しているのは比較的後付のものが多いのではないだろうか.全てがデファクトスタンダードで成り立っているとまでは言わないが,ディスカッションでも出ていた様に,キラーアプリ無くして標準化も無いのではないだろうか.一方で,標準化をして沢山の開発者を巻き込まないとキラーアプリが出てくるチャンスが中々出てこないと言うのも事実かもしれない.

2005年10月19日

ことばの科学研究所 研究集会

 ことばの科学研究所 研究集会という発表会で,研究室の学生が発表するので付いて行きました.
 私の母校である早稲田大学本庄高等学院とほぼ同じ場所にあるGITSの本庄キャンパスで行われました.
昼ごはんを研究室の人達を連れて高校の食堂でとっていたら,高校3年間担任としてお世話になっていた先生が現れたので挨拶をしました.高校のときは目立たない学生だったので,覚えていただけてるかちょっとだけ不安でしたが,覚えて頂けていたようです.
 発表会自体は,小規模だったものの,学会とは一味違う意見を貰えたのでよかったかなと思います.
 小規模であっても,研究室内のゼミでは無い公式な場で発表するということは学生にとっていい刺激になったのでは無いかと思います.

2005年09月26日

音響学会@仙台

 明日からの音響学会のために仙台に来ました.
 東北新幹線に乗ったのはかなり久しぶり. 家(埼玉北部)が見えるかと思ってずーっと外を見てましたが, 大宮を出てしばらくしたらすぐ小山になっていて,まったく分からなかった. まあ,家の付近は照明がほとんど無くて暗いので夜は全く見えなくて当然だったのかも知れません.

2005年09月20日

21世紀夢ウイーク~飛騨高山ロボットワールド~

 岐阜県高山市で行われた「21世紀夢ウイーク~飛騨高山ロボットワールド~」というイベントにロビスケを展示してきました.
 今まであまり興味が無くてチェックしてなかった小型の2足歩行ロボットの格闘大会「ROBO-ONE」と併催されていたため,来場者数もかなり多く,また,普段の来場者とも一味違うお客さんと話をする機会にも恵まれました.
 ROBO-ONE参戦の人はどちらかというとロボットの制御の方に興味がある人が多く,音声対話ロボットというのは新鮮に感じる人が多かったようです. 「こんなことできて当たり前でしょ?」的な反応をされるのではないかと思ったのですが,「凄いことやってるね~」と驚いてくれる人が多かったと思います.
 今後の課題はまだまだ山積みですが,これからも頑張って行きたいと思います.

21世紀夢ウイーク~飛騨高山ロボットワールド~の続きを読む

2005年09月09日

Interspeech2005 (Eurospeech) @ Lisboa, Portugal

 行ってきました.発表してきました.
 今回はポスター発表.数名,似たような研究をしている人の意見をいただきました.
 相槌・復唱を含めた,音声対話における発話タイミングの制御っていうのはかなりホットな話題のようです. ちょっとアドバンテージがあるうちに,やれることはやらなければ,という気持ちになりました.

2005年08月20日

学びの支援フォーラム

20050919daigakutsusin.jpg  有楽町にある東京国際フォーラムで行われた 「学びの支援フォーラム」に,早稲田大学の代表としてロビスケを展示してきました.
 東京都私立学校(小中高)の説明会と併催だったために, いつものちびっ子とは一味違う賢そうなお子様方が見学していきました.

 ※写真は隣にあるビックカメラ有楽町店で行われたモリゾー&キッコロとの記念撮影会の為に連行されるキッコロ.えらそうな人に歩くの遅いって怒られてました.あのぬいぐるみじゃ走るの無理あるって….

2005年05月04日

人はどうでもいいです.

 「他人がどうしようと気にしない」っていう意味では無くて. 何か理論を説明するときに, 人間の脳がどのような情報処理しているかを引き合いに出す人がいるんだが, それで説得力は増さないと思う.
 人間に「匹敵する」知覚的な器官を作り出すために, 人間を「参考にする」のは確かに必要だが, まるまる真似る必要は無い.というのが私の持論です. 確か金出先生も同じようなことを言っていたような. 違ったらすみません.
 「人間の脳でもこういう計算してるんだよー.すごいねー.」 っていうのはせいぜい素人に話すときに限定すべき.
 無論, 人間の脳の仕組みを明らかにしようとしている人や, 人間を作りたいと思っている人は上記の議論には関係ありません.

2005年04月07日

最長しりとり問題の論文

 以前,ここで話題になっていることで知った「最長しりとり問題」. そもそもは,フジテレビの『トリビアの泉』で取り上げられた問題で, 一見簡単そう(根性でやれば解けそう)だが, 超高速なコンピュータでやってもまともにやると一生のうちには決して終わらないという 計算論的に面白い問題です.
 ふと解説ページを見てたら,情報処理学会の論文誌にこれに関する論文が掲載される予定のようです.…って思ってちょっと調べてたらOR学会誌にも同名の論文が載ってるなぁ.解説記事だからちょっと違うのかな.

2005年04月01日

研究室配属シリーズ~オープンハウス1日目

 今日は、研究室配属のため、新4年生に研究室を開放し、説明を行う毎年恒例のオープンハウス1日目でした。毎年恒例とはいえ、来年からは新4年生が新学科体勢になるので、もしかしたら今年で最後かもしれません。昨日の助手のミーティングで発覚したんですが、結構各学科で配属の仕方が異なるようです。電気学科のやり方が一番(助手や先生が)大変、だけど(学生にとっては)いい方法かもな、と思いました。
 さて、1日目は午後の3時まで先生方の説明会があるので、実質2時間か3時間程度しか見学の時間はないのですが、第1志望の学生は大体1日目にくる傾向にあると思います。で、うちの研究室ですが…。まあ、情報に左右される学生が多いようなので書きません。
 僕が4年生に上がったときは、幸いにも成績的には余裕があったし、小林研以外には考えてなかったので、1日目に小林研だけ見学して、ROBITA(当時はまだ名前がなかったなぁ)が動かない状況を見学し、2日目は塾講師のバイトに行ってました。
 今考えるとほかも見学しておけばよかったかなぁとも思います。最終的には小林研にしたと思うけど、他の研究室を見学する機会なんて、隣の研究室ですら全く無いですから。研究の内容は修論審査会などで見られるけど。

2005年03月28日

顔画像メモ

2005年03月27日

Discovery Channel Canada

discovery.jpg  Discovery Channel Canadaの取材を受けたのは以前にもお伝えしましたが, とうとう最近放送されたようです.Webでも見れます.画質・音質はあまりよくありませんが.
 英語で解説が出来ず,結局リポーターのジェイさんに全部喋ってもらいました(涙).

 Discovery Channel Canada
 ビデオの直リンク





2005年03月25日

博士

 卒業式があり,博士(工学)の学位を授与されました.

 数々の紆余曲折(という程でもないですが)を経て, 4年間かけて取れました.
 今考えてみると, 博士課程に進んだ最初の頃は自分自身のテーマも不安定な状況で, 研究の進め方も粗っぽく(この点は今後も改善していく必要あり), 私の指導下に置かれていた後輩諸氏にはかなり迷惑をかけていたと 思います.
 テーマが現在のものになってからは, 視野も広がり,問題点も一つ一つ浮き彫りになって来て, 自然と研究が回るようになりました. それに付随して,発表する機会も後輩を含めて多くなり, 研究の面白さを改めて実感できるようになりました.

 このような経緯で取得に至ったので, 学部や修士の時から一貫したテーマで研究を突き詰めて来た人達に比べると, まだまだ勉強すべきことがたくさんあると思っています. 博士学位授与式で白井総長が
自分でこれがテーマになるとか, 解ける解けないに関わらず問題として取り上げることの重要性がわかる. こうなってくるのは博士課程が終わってしばらくしてからだった.
とおっしゃっていました.
 今までテーマにして来たものは, 自分で考えたものだと思っていても, 小林先生や諸先輩・後輩方が築き上げた恵まれた環境の中で見つけられた, もしくはその環境に与えられたと言ってもいいものであり, オリジナルというわけではないと思っています.
 今後は,今ある環境が変化した時を見据えて, どう問題を切り出していくか, ということを常に意識しながら研究をしていきたいと思います.

 ありがとうございました.

2005年02月24日

人工知能学会SLUD研究会@早大理工

 3月4日にこの研究室がある建物で開催.
 昨日,先生宛の資料が届いているので気が付いた. 自分の情報収集不足も否めないが, せっかくこんなに近くであるのに見逃さずによかった.
 しかし3月頭は情処の発表も(自分が登壇じゃないけど)あって, 結構私にしては過密なスケジュールだ. 重ならなくてよかったけど.

第43回 言語・音声理解と対話処理研究会 (SIG-SLUD)