音声インデクシング技術

【『音声インデクシング技術』、一言で言うと】
映像に含まれている音声データから、話されている内容をテキスト化すると同時に、XMLによるメタデータ化を全自動で行なうことで、映像コンテンツの一覧性や検索性を高める技術

詳細な解説は、リクルートキーマンズネットの「音声インデクシング技術」へどうぞ。

キーマンズネットより引用

映像に含まれている音声データから、話されている内容をテキスト化すると同時に、XMLによるメタデータ化を全自動で行なうことで、映像コンテンツの一覧性や検索性を高める技術のこと。
メタデータとは、「コンテンツに関するデータ」であり、コンテンツに対してさまざまな観点から情報が付与される。メディアのタイプ、データサイズ、最終更新日などの形式的な情報から、本質的なコンテンツの意味内容に関する情報はもちろんのこと、著作権や利用条件などにかかわる付帯情報なども含まれる。こうしたメタデータを適切にコンテンツに付与する作業は、これまで人手に頼るところが多く、それを効率化する技術が求められてきた。
高度なコンピュータ処理を駆使した音声インデクシング技術により、音声や画像といった「ディジタル信号」から、メタデータという「内容を記述したデータ」を自動的に作成することが可能になるのだ。

この続きは、リクルートキーマンズネット「音声インデクシング技術」で。

Follow me!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA