2005年01月31日
音声入力部
音声入力部を一新しようと思った.
今は,卒業生が作ってくれたgtkを使ったGUI付きの音声入力ソフトを使っている.
GUIはあった方がよい.でもgtkなのでC言語.拡張はC++でやってるので,できればC++でやりたい.
でもLinuxのC++でグッと来るGUIツールキットがないんだよなーこれが.
結局のところgtk+のエクステンションのgtk--がいいと思うんだが,最新バージョン(もしくは利用が許せる程度の古さのバージョン)がDebian Woodyでは使えない.
だから,Eclipseに乗り換えようと思って,今日やってみた.前は動かなかったが,先日買ったRedHat ES3のマシンでは動いた.のでssh経由でやってみた.
確かに軽快だしEmacsキーバインドが使えてグッと来たが,Javaで音声入力,はたまたMFCCへの変換,F0の抽出など,実装するのか?と考えるとお先真っ暗.
明日はもう一度新しいgtk--のインストールにチャレンジしてみようっと.
今は,卒業生が作ってくれたgtkを使ったGUI付きの音声入力ソフトを使っている.
GUIはあった方がよい.でもgtkなのでC言語.拡張はC++でやってるので,できればC++でやりたい.
でもLinuxのC++でグッと来るGUIツールキットがないんだよなーこれが.
結局のところgtk+のエクステンションのgtk--がいいと思うんだが,最新バージョン(もしくは利用が許せる程度の古さのバージョン)がDebian Woodyでは使えない.
だから,Eclipseに乗り換えようと思って,今日やってみた.前は動かなかったが,先日買ったRedHat ES3のマシンでは動いた.のでssh経由でやってみた.
確かに軽快だしEmacsキーバインドが使えてグッと来たが,Javaで音声入力,はたまたMFCCへの変換,F0の抽出など,実装するのか?と考えるとお先真っ暗.
明日はもう一度新しいgtk--のインストールにチャレンジしてみようっと.
- Permalink
- by fujie
- at 22:52
- in 研究
- Comments (0)
- Trackbacks (0)






とのこと.
踊りに関して言えば,SONYのQRIO(当時はSDR)が既にパラパラを踊っているので,タスクとしては目新しくはない.
ポイントは,プレスリリースにもあるように,モーションキャプチャを用いて抽出した動作を再現したところにあるだろう.
QRIOのものは,開発者が手作りしたものである.
手作りしたものの方が意図通りの動きを行わせることができるが,
自由度が増えたることによってその作業は極端に困難になる.
また,モーションキャプチャで捉えたとおりに自由度を操作するのは簡単だが,
操作しつつバランスを取って二足で立っているというのがかなり難しい.
ここに関する対処が評価されるべきところだろう.

You Ready, B?