もう13時か、

【IT/出版】国会図書館が出版物の全文テキスト化実験、参加出版社・印刷会社を募集 [10/07/20](7)

1 依頼@@@@ハリケーン@@@φ ★ 2010/07/22(木) 12:22:52 ID:???
 国立国会図書館は20日、出版物の全文テキスト検索のための実証実験を行うとして、参加
する出版社や印刷会社の募集を開始した。募集期間は8月31日17時まで。

 実験では、出版物の版下データや電子書籍データなどからテキストを抽出し、汎用フォー
マット化する。さらに、このテキストデータを館内で検索・表示したり、出版社など外部か
ら利用するためのAPIについても実験する。

 10月から2011年1月まで実証実験用のシステムを構築した後、2月から3月までかけて実証
実験の実施および結果のとりまとめを行う。

 参加する出版社や印刷会社は、デジタル出版データの提供などで実験に連携・協力するか
たちになる。

【追記 18:30】
 実証実験では、賛同する出版社などから提供されるデータに加え、国立国会図書館が独自
にデジタル画像データ化を進めている、著作権保護期間が終了した古い出版物の汎用フォー
マット化も並行して行う。こちらは主に視覚障害者向けの読み上げのための活用を想定して
いるという。

 なお、実験で用いる汎用フォーマットは、テキストデータに、出版物のタイトルや目次、
本文、章などの構造を示す情報が付加されたものだが、具体的なフォーマット名は現時点で
は未定。どのようなフォーマットが汎用フォーマットとして利用できるかも含め、今後、
調査・検証していく。

関連情報
■URL
 プレスリリース
 http://www.ndl.go.jp/jp/aboutus/digitization_fulltext.html

ソース:impress
http://internet.watch.impress.co.jp/docs/news/20100720_381934.html
http://internet.watch.impress.co.jp/img/iw/docs/381/934/ndl1.jpg
総レス数 7

■ このスレッドは過去ログ倉庫に格納されています

IE等普通のブラウザで見る場合 http://tubo.80.kg/tubo_and_maru.html
専用のブラウザで見る場合 http://www.monazilla.org/

2ちゃんねる Viewerを使うと、すぐに読めます。 http://2ch.tora3.net/
この Viewer(通称●) の売上で、2ちゃんねるは設備を増強しています。
●が売れたら、新しいサーバを投入できるという事です。


よくわからない場合はソフトウェア板へGo http://hibari.2ch.net/software/

モリタポを持っていれば、50モリタポで表示できます。




read.cgi@hanako ver 2011/01/22
FOX ★ DSO(Dynamic Shared Object)