CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

EC-CUBEの脆弱性が発覚(緊急度:高)

ECサイト用オープンソース「EC-CUBE」に緊急度「高」の脆弱性 WordPressなどと並んでオープンソースとして馴染みのある「EC-CUBE」に緊急度の高い脆弱性が発覚し、提供元よりバージョンア …

no image

[SNS]TwitterのウィジェットをMovableTypeのサイドバーに追加する方法

Twitterのウィジェットをサイドバーに MovableType3.36での方法です。(MT4での手順はいくつかあったが、MT3ベースの手順はあまり見あたらずMT4を参考にトライ) ※あくまでもワタ …

no image

[PC遠隔操作事件]横浜市Webサイトへの小学校襲撃予告

最近お会いした方から「アットライズさん大変だったんじゃない?」と言われることが何回かありました。 当社で横浜市公式サイトのリニューアルを担当させていただいたことをご存じで、今回の遠隔操作事件の対応で大 …

翻訳サイトから情報漏洩の危険性!

便利の裏に潜む脆弱性 インターネットはとても便利だ。 翻訳サイトも充実しており、ワタシの拙い知識で英語を読むより 翻訳サイトで日本語変換した方がよっぽど理解できちゃったりする。。(>_<) …

Webサイトがある日突然閉鎖されてしまったのはナゼ?

サーバーとドメインの契約は自社でしている 弊社でWebサイトの運用更新をさせていただいているお客様から、「突然サイトが見れなくなった。調べてほしい!」との連絡が。 このお客様、サイトの運用更新は弊社で …