CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

no image

「winmail.dat」というメールの添付ファイル

業務関連で送られてきたメールに「winmail.dat」というファイル名のファイルが添付されていた。   事前の話ではWordファイルが送られてくるハズであったが。。   調べてみると、この「winm …

no image

メモリ増設

最近、PCが目に見えて遅くなった。。 朝から使い始めて、午後になると再起動しなければならないくらい。。 特に新しいアプリケーションをインストールした、とかもないのに、、 Windowsアップデートが多 …

Windows updateで、PCが起動しなくなる!! 件の 見極め方と対処

Windowsをシャットダウンするときに、自動で「Windows update」なるものが動き、それが終わるまでなかなか電源断できないことがある。。 最近のWindows updateで深刻な不具合が …

no image

今日の朝礼:2012/07/31(金)「ソーシャルメディアとスマフォの電話帳管理」(後編)

昨日は「LINE」にまつわる話を書いたが、今日は「Facebook」にメールアドレスが晒されてしまった話を。 ナゾの書き込み… その日、いつものように早起きしてFacebookを見ていたら、、 なんと …

IEの脆弱性:WindowsXP向けセキュリティパッチも公開。。

  4/26に脆弱性が発覚して大騒ぎとなった Microsoft社のブラウザ「Internet Explorer(IE)」について、5/1のブログで書いた。 このときのブログでは、 尚、先月 …