CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

国際ロボット展に行ってきた

国内外の最新ロボット技術、AI等が出展 11/29(水)~12/2(土)まで東京ビッグサイトで開催された「2017国際ロボット展」に行ってきた。 こういった展示会では珍しく土曜日までの開催で、、土曜日 …

無料グループウェア「サイボウズLive」がサービス終了!

2019年4月15日をもってサービス終了 グループウェアの老舗とも言えるサイボウズ。 その無料サービスである「サイボウズLive」が、再来年(2019年)4月15日で終了すると発表された。 サイボウズ …

サイトのアクセス数が4ヶ月で4倍になったワケは?

思いがけずバズることがある! お客様のホームページ制作を行うのと並行して、アクセス解析やアクセスアップのコンサルティングなども行っている。 とあるクライアントさんのサイトで興味深いアクセス数の変化があ …

意外な盲点:WebサイトのURL、wwwあり/なしどちらでも動作しますか?

同じサイトでもwwwあり/なし 2種類の表示方法 WebサイトのURL、よく見ると 同じサイトでも以下のようにwwwありとwwwなし2種類存在するの、ご存知ですか? https://www.attri …

ドメインの乗っ取りにご注意を!

昨日から今日にかけてのIT系のニュースで国内「.com」サイトでドメイン乗っ取り、不正サイトへの誘導被害もというのがあった。 ※本ブログでは一例を示しています。(この例以外のケースもあり得ます。) 意 …