2010年11月10日水曜日

スキャン本の検索

電子書籍の流通が一般的になるまでは、しばらく自炊生活が続くだろう。
このようなときスキャン本の検索機能がほしくなる。
CDをリッピングしても、そのデータから曲名が検索できる。
これは元がデジタルデータなのでさほど困難ではない。音楽の場合、データでも文字がないため、それを補う必要があるため、このようなサービスが発展している。
電子書籍なら最初から検索出来て当たり前だ。
しかし、デジタルでもスキャンした本には文字情報がなく、検索のためには精度の低いOCRをしなければならない。この手間は大きい。
しかし、ソーシャルとして考えれば、誰かがすでにOCRしている可能性がある。それを検索するために、表示のイメージ同士でマッチングを行うことが考えられる。
これにはイメージ検索が使える。
このようなデータの共有には2つの意味がある。1つは無駄な手間と重複する情報量の削減だ。もう1つはコンテンツ保護だ。正当な所有者であることをイメージで示すわけだ。もちろん、これは抜本的な方法ではない。抜本的な保護のためには最初から電子化してなければならない。

0 件のコメント: