CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

簡単多言語化:WebサイトにGoogle翻訳を埋め込む方法

完璧ではないが、そこそこ意味は通じる ※2021.03.29追記  本方法は、Google Translateが新規登録を終了しています。。  代替案は > https://attrise.blog/ …

EC-CUBEの脆弱性が発覚(緊急度:高)

ECサイト用オープンソース「EC-CUBE」に緊急度「高」の脆弱性 WordPressなどと並んでオープンソースとして馴染みのある「EC-CUBE」に緊急度の高い脆弱性が発覚し、提供元よりバージョンア …

ネット広告費、新聞抜く

電通の発表によると、「2009年の広告費」で、ついに「ネット広告費」が「新聞広告」を抜き、「テレビ広告」についで第二位になった、と。 ITmediaの記事は > こちら 他のマスメディアは軒並み二ケタ …

古いハードディスクの完全廃棄(その3)

情報漏洩は自身で防がなければならない 古くなったパソコンの処分。特に仕事で使っていたパソコンのハードディスク(HDD)は、個人情報を含む機密情報が てんこ盛りだ。 昨年末、神奈川県庁で業者に委託してデ …

新手のスパム!Analyticsの解析で「social-buttons.com」からのReferralが大量にきてる!

アクセス数が増えて喜んでいたら。。 Google Analytics でお客様のサイトを分析していたら、参照元が「social-buttons.com / referral」からのアクセスが大量に来て …