CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

今年上半期、ネットでこんな買い物してた(^^;

はたしてどうかな? 最近はネットでためらいなく買い物をする。 安くて便利で早いから。 で、今年の上半期、個人としてネットでどんなものを買っていたか、まとめてみた! 生活感あふれるが(笑)、、一挙大公開 …

Yahoo検索順位が変わる!?

「Yahoo!検索 スタッフブログ」より http://searchblog.yahoo.co.jp/2008/08/yahoo_index_update_2.html 以下、記事抜粋。 Yahoo! …

EC-CUBEの脆弱性が発覚(緊急度:高)

ECサイト用オープンソース「EC-CUBE」に緊急度「高」の脆弱性 WordPressなどと並んでオープンソースとして馴染みのある「EC-CUBE」に緊急度の高い脆弱性が発覚し、提供元よりバージョンア …

ついにAdobe「Flash」が2020年サポート終了へ!

Webアニメーションの草分け的存在 Adobe社の「Flash」が、ついに2020年にサポート終了すると発表された。  ※ITmediaの記事は > こちら Adobe「Flash」と言えば、Web系 …

no image

[EMOBILE]イーモバイル不具合:メール送信できない

今日、打合せ中に「EMOBILE」で接続したノートPCからメールを送ろうとしたらエラーとなって送信できない。(モバイル用USBタイプ「D​1​2​L​C​」) このイーモバイルについては、7/3の日記 …