本案件遂行責任者のM2の柴田君が寄稿してくれました。株式会社ケイ・シー・シーさん(リンク)の手話動画製作を担当されている小林さんに協力をいただいています。その会社へのクイック報告?をかねているとも思われます。
++++++++
本日、手話認識の研究で使うための手話動作撮影を行いました。
前回は5/11(http://blog.cs.kanagawa-it.ac.jp/2016/05/blog-post_31.html)に撮影を行いました。今回はさらに15種の単語、手話者3人を新たに加えて追加撮影を行います。本日はその2日間の内の1日目でした。
撮影するに当たり前回と同様に小林様(ケイ・シー・シー)(http://www.kcc.co.jp/)に監修して頂くことで、正確なデータを採取することができました。手話の微妙な動きや速度による意味の違いは素人ではわからないことが多々あります。そのためわずか15単語でも監修下での撮影は大いに意味があったと感じました。
我々の撮影したデータは手話のコーパスとしての意味があります。よって定めた単語を定めた回数分撮ることはとても重要です。今回は前回に比べて取得データが多く時間も限られているため、ミスなく・効率よく撮影しなければなりませんでした。(HIRO追記:機械学習のために、単語一つひとつにつき、多数の動画取得が必要です。人によって、動きが若干異なることを考えると明らかです。また、同一人物でも全く同じ動きを再現できません。)
今回は1単語の撮影を終え、その動画を小林様と小澤君で確認している間に、次の単語の動きを手話者に確認してもらうことで効率よく進めることができました。予定していたスケジュール通りに進めることができたのは、昨夜何度も撮影練習を行った成果だと思います。
また、今回の撮影にはもう一つ大きな目的があります。それは4年生の小澤君が主導して撮影することが出来るようにすることです。私は今年度で卒業のため、やり方を覚えてもらわなければ来年以降研究を続けることができません。今回は小澤君に撮影準備から撮影のメインまでの一通りを務めてもらいました。今回得たノウハウをぜひとも今後生かしてほしいと思います。
(データ取得に協力してくれている紅一点の成岡さん。私には、覚えられないような動きも多々あります。協力に感謝します。HIRO追記)
今回も忙しい中、小林様には撮影に協力して頂きました。今回撮影したデータと前回のデータを使いCEATECでデモ展示をする予定です。そのため責任感を持ってCEATECの展示を行い、今回取得したデータを用いてアウトプットを出すことが我々の責務だと思っています。
****
今大きな話題となっている機械学習(ディープラーニング(深層学習)もこの一つ)を使って手話の自動認識(要するに、コンピュータによる認識)を行います。コンピュータの学習のために、多くの手話動作のデータが必要となります。学習が重要かつ、時間も要するのは人間もコンピュータも同じです。要するに、たくさん学習した方がよい性能が出るのは、人間もコンピュータも同じってことですね。決して、読者の方へのイヤミではないので、念のため。でも、コンピュータには過学習という問題もあります。要するに、勉強のしすぎです。人間にはないと思いますが・・・。少なくとも我々には。
0 件のコメント:
コメントを投稿