CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

善意の人は要注意!チェーンメールと架空請求

意外と引っかかる人がいるので要注意! 昨日今日と、立て続けにスパム(チェーンメールと架空請求メール)に遭遇したので、ちょっと書いておこう。 善意で回覧してしまうチェーンメール 昨日Facebookの知 …

no image

横浜市デザイン相談

横浜市で、「横浜市デザイン相談」という事業を行っている。 このデザイン相談、市内に事業所のある中小企業を対象として、年間5回まで ナント無料で相談に乗ってアドバイスをしよう! という太っ腹なもの。 し …

ネット上の「忘れられる権利」

ネット上には、誤った情報や誹謗中傷など、、不適切な情報も溢れている。 それが自分に関することとなれば、一刻も早く消し去りたい、と誰もが思うだろうが、一度アップされた情報を削除するのは簡単ではない。いや …

【Gmail仕様変更】2026年1月でGmailifyのPOP サポート終了!

自社メールが受信できなくなる可能性 自社メルアド等(例:xxx@yyyy.co.jp)をGmailを使って POP受信している方、来年の1月以降 メール受信できなくなるとのことなので、他の方法へ代替す …

no image

昔のサイトが見られる:Internet Archive

昔のサイトを丸ごとアーカイブしている、その名も「Internet Archive」(インターネットアーカイブ) http://www.archive.org/   このサイト、見たいサイトのURLを入 …