CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

「だったら けしからん!」っていうネットの怖さ

ネット上にはいろんな情報があふれている。。 中には飲食物の素材などについて、恐怖感や嫌悪感を煽るような まことしやかに書かれたものなどもあり、それを読んだ人がSNS上で次々にシェア、フォローして広がっ …

[常時SSL化(2)]WordPressサイトの常時SSL化

WordPressは データベースの変更も必要になる 既存サイトの「作り」によって常時SSL化の難易度が異なる件は、「[常時SSL化(1)]Webサイトの常時SSL化」で述べたが、ここではWordPr …

「神奈川県テレワーク導入促進事業費補助金」事前登録開始!

本補助金申請には「事前登録」が必要! 令和3年度神奈川県テレワーク導入促進事業費補助金の交付申請の「事前登録」が、本日よりスタートしました。 ※本補助金を申請するには、必ず「事前登録」する必要がありま …

ネット広告費、新聞抜く

電通の発表によると、「2009年の広告費」で、ついに「ネット広告費」が「新聞広告」を抜き、「テレビ広告」についで第二位になった、と。 ITmediaの記事は > こちら 他のマスメディアは軒並み二ケタ …

不正アクセスでスパムメールの踏み台に。。

セキュリティホールを突かれたり、安易なパスワードを破られたり、はたまた モニタに付箋紙でパスワードを貼り付けていたり、、 不正アクセスされる要因はいろいろあるが、、 不正アクセスによる被害にはいろいろ …