CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

[備忘録]GoogleAnalytics:ページ毎のアクセス解析方法

ページ毎に絞り込む方法 ホームページ制作に欠かせない、Webサイトのアクセス解析ツール「Google Analytics」(グーグルアナリティクス)で、ページ毎に表示する方法を。 行動→サマリーから …

ホームページの常時SSL化とは?

今後は常時SSL化がWebサイトの主流に セキュリティ対策として、ホームページ(Webサイト)をSSL化(htps://…)することは、今までは個人情報等を入力する「問い合わせ」や「注文」 …

善意の人は要注意!チェーンメールと架空請求

意外と引っかかる人がいるので要注意! 昨日今日と、立て続けにスパム(チェーンメールと架空請求メール)に遭遇したので、ちょっと書いておこう。 善意で回覧してしまうチェーンメール 昨日Facebookの知 …

新ドメイン、続々登場!

「.com」や「.co.jp」などのトップレベルドメインに、新ドメインが次々誕生している。 例えば、 .club :クラブ (会員制サービスやナイトクラブなど) .coffee :コーヒー (メーカー …

no image

[CMS]MTの画像アップ:サムネイルのデフォルト設定変更

サムネイルのデフォルト設定変更がとっても面倒 Movable Typeで画像をアップする際、サムネイル画像の設定で、デフォルト値が通常自分が設定する値と違うため、写真ごとに設定値を変更する必要があり、 …