CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

ネット広告費が1兆円突破!一方、工夫次第で効果的なPRも

ネット広告費はスゴイ勢いで伸びている! 電通が、「2014年日本の広告費」を発表した。 これによると、ネット広告が初めて1兆円の大台を突破した! という。 ※ITmedia:ネット広告、初の1兆円超え …

究極のバックアップ、ハードディスク丸ごとコピー!

備えあれば憂いなし バックアップといっても、用途に応じてさまざま 共用ファイルサーバーのバックアップ方法について、以前のブログ(*1)で書いたが、今回はパソコンのHDDを丸ごとコピーしてしまうという方 …

[常時SSL化(2)]WordPressサイトの常時SSL化

WordPressは データベースの変更も必要になる 既存サイトの「作り」によって常時SSL化の難易度が異なる件は、「[常時SSL化(1)]Webサイトの常時SSL化」で述べたが、ここではWordPr …

新たな脆弱性、あなたのWebサーバーは大丈夫!?

コンピュータ、ネットワーク機器に脆弱性が見つかるたびに、その対処などのフォローが必要になる。。 Windowsの場合は、「Windows Update」というプログラムで自動的に対処ファイルがインスト …

Web&モバイルマーケティングEXPO

昨日、東京ビッグサイトで開催中の「Web&モバイルマーケティングEXPO」へ行ってきた。     今年はCMS関連のブースが多かった。 あと、SEOやアクセス解析関連もあったが、思ったほどでは …