CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

【注意】ウィルス添付のスパムメール

一見、スパムとは分かりづらい巧妙なウィルスメール 最近、ウィルスと思われるファイルを添付したスパムメールが頻繁にくる。 タイトルも、 「商品発送手続完了のお知らせ」 「Re: 写真ありがとうこざいます …

スパムメールが どんどん巧妙化している。。

迷惑メールは毎日届く。。 迷惑メールと呼ばれる、、こちらが意図してないのに(歓迎してないのに)一方的に送られてくるメールは、日々何十通も届く。。(>_<) 一度でも名刺交換していたり、何ら …

テレワーク、本格導入にあたって考慮したこと

これをきっかけにテレワーク化が一気に進むか 新型コロナウィルス感染対策として、当社でもテレワークを本格導入した。 どちらかと言うと自分は、今まで リモート会議システムなどを使った取引先との打合せにも消 …

no image

今日の朝礼:2012/07/12(木)「Google新サービス:Google Maps Coordinateについて」

今朝の朝礼の話題は、Google Mapsの新サービス「Google Maps Coordinate」について。 このサービスは、企業向けの有料サービスで、GPS位置情報を利用してオフィスの外にいる社 …

no image

昔のサイトが見られる:Internet Archive

昔のサイトを丸ごとアーカイブしている、その名も「Internet Archive」(インターネットアーカイブ) http://www.archive.org/   このサイト、見たいサイトのURLを入 …