CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

【注意】ウィルス添付のスパムメール

一見、スパムとは分かりづらい巧妙なウィルスメール 最近、ウィルスと思われるファイルを添付したスパムメールが頻繁にくる。 タイトルも、 「商品発送手続完了のお知らせ」 「Re: 写真ありがとうこざいます …

SSL証明書って本当に必要?

SSLは データを暗号化し盗み見などを防ぐ技術 Webサイトの申込みフォーム等で広く普及している「SSL」。 URLが通常の「http://」ではなく「https://」になり、ブラウザのURL欄に鍵 …

Webサイトには魂が宿る!

作り手の情熱が反映される Web業界で仕事をしてきて15年以上。数々のWebサイト構築に携わってきて感じるのが、Webサイトには魂が宿るということ。     ※出典:拙著「Webサイト制作・運営に役立 …

Windows updateで、PCが起動しなくなる!! 件の 見極め方と対処

Windowsをシャットダウンするときに、自動で「Windows update」なるものが動き、それが終わるまでなかなか電源断できないことがある。。 最近のWindows updateで深刻な不具合が …

検索結果がトップページではなく会社案内などになってしまう場合の対処方法

Googleに正しく認識させること 知り合いから「自社の業種で検索すると、トップページではなく会社案内ページが検索結果として表示されてしまう」という相談を受けた。 自分なりに調べてみて、 (1)トップ …