CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

WordPressに深刻な脆弱性

しばしば発覚する脆弱性 WebサイトのCMS(更新システム)として広く普及しているWordPress(ワードプレス)ですが、Windowsがさまざまなセキュリティホールを突かれているのと同様に、シェア …

Web動画は押さえておきたい!セミナーで聞いた企業動画活用のポイントは意外にもアナログ的なことだった

デジハリ主催「企業の動画活用セミナー」に参加 昨日、デジハリ主催の「コクヨチャネルの仕掛け人に聞く、企業の動画活用セミナー ~Web動画は果たして事業成長の起爆剤になるのか~」に参加してきた。 マーケ …

ホームページの常時SSL化とは?

今後は常時SSL化がWebサイトの主流に セキュリティ対策として、ホームページ(Webサイト)をSSL化(htps://…)することは、今までは個人情報等を入力する「問い合わせ」や「注文」 …

意外な盲点:WebサイトのURL、wwwあり/なしどちらでも動作しますか?

同じサイトでもwwwあり/なし 2種類の表示方法 WebサイトのURL、よく見ると 同じサイトでも以下のようにwwwありとwwwなし2種類存在するの、ご存知ですか? https://www.attri …

「だったら けしからん!」っていうネットの怖さ

ネット上にはいろんな情報があふれている。。 中には飲食物の素材などについて、恐怖感や嫌悪感を煽るような まことしやかに書かれたものなどもあり、それを読んだ人がSNS上で次々にシェア、フォローして広がっ …