CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

またまた、、WordPressに深刻な脆弱性

今度は「深刻な」との前置き付き。。 WordPressの脆弱性については10/2のブログ(WordPressの脆弱性への対応)でも書きましたが、またまた脆弱性が発覚しました。 しかも今度は「深刻な」と …

「だったら けしからん!」っていうネットの怖さ

ネット上にはいろんな情報があふれている。。 中には飲食物の素材などについて、恐怖感や嫌悪感を煽るような まことしやかに書かれたものなどもあり、それを読んだ人がSNS上で次々にシェア、フォローして広がっ …

SSL証明書って本当に必要?

SSLは データを暗号化し盗み見などを防ぐ技術 Webサイトの申込みフォーム等で広く普及している「SSL」。 URLが通常の「http://」ではなく「https://」になり、ブラウザのURL欄に鍵 …

他人事ではない、、ネットでお金が盗まれる!

身近な人も被害にあっている パソコンの不正アクセスや、個人情報流出などにより、銀行預金が勝手に第三者の口座に振り込まれたり、知らぬ間に自分のカードが使われていたり、、 そんな話が身近でも聞かれるように …

Google翻訳すげー!会話モードでポーランド人と話してみた。

ホントに使えた!Google翻訳 先日、盛和塾横浜の勉強会にポーランドの方々が参加された。 そこで、かねてから「試してみたい!」と思っていた「Google翻訳」の会話モードで会話してみたら、、ちゃんと …