CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

ディスクのバックアップ、ベストな方法とは?(その2)

バックアップツールを決めるに至るまで 昨日のブログでバックアップディスクの構成について書いたが、今日はその続編でバックアップツールのチョイスについて、試行錯誤の末 最終的に落ち着くまでの経緯を書いてい …

オンライン決済サービス「WebPay」サービス終了

4月末でサービス終了 昨年10月、ネット上のオンライン決済代行サービスである「WebPay」(運用会社:ウェブペイ株式会社)が、突然「2017年4月末でサービスを終了する」と発表した。 WebPayは …

Windows7サポート終了の足音。。

あと2年。 WindowsXPがサポート終了し、Windowsアップグレード対応で世の中を賑わせたのが2014年4月。 あれから3年半、、大きな山を越えた安堵感に 平穏なPCライフを送っている人も多い …

[備忘録]WordPressの常時SSL化でBizVektorテンプレートの対応

[常時SSL化(3)]WordPress:BizVektorの落とし穴 常時SSL化については、下記ブログで述べてきたが、 ・[常時SSL化(1)]Webサイトの常時SSL化 ・[常時SSL化(2)] …

迷惑メールフィルタ

仕事がら多くのメールアドレスを使っており、またネット上で公開しているアドレスなどもあり、迷惑メール、スパムメールが日々たくさん来る。 平均500~多い日で1000通くらい。。。orz なので、受信メー …