CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

アクセス集中対策「Web待合室」を設置!

サーバーの過負荷スタックを防ぐ「Web待合室」 弊社のお客様で、毎年パシフィコ横浜で大規模なイベントを開催されるクライアントがある。 コロナ以降 入場者数の制限をすることになり「事前予約制」とすること …

テレワーク、本格導入にあたって考慮したこと

これをきっかけにテレワーク化が一気に進むか 新型コロナウィルス感染対策として、当社でもテレワークを本格導入した。 どちらかと言うと自分は、今まで リモート会議システムなどを使った取引先との打合せにも消 …

意外な盲点:WebサイトのURL、wwwあり/なしどちらでも動作しますか?

同じサイトでもwwwあり/なし 2種類の表示方法 WebサイトのURL、よく見ると 同じサイトでも以下のようにwwwありとwwwなし2種類存在するの、ご存知ですか? https://www.attri …

Webサイトには魂が宿る!

作り手の情熱が反映される Web業界で仕事をしてきて15年以上。数々のWebサイト構築に携わってきて感じるのが、Webサイトには魂が宿るということ。     ※出典:拙著「Webサイト制作・運営に役立 …

サーバーや技術的な社内勉強会を開催しました。

意外と奥が深いサーバー関連の技術的なノウハウ 今週の月曜日、社内でサーバーや技術的な勉強会を開催しました。 「Webサイトを公開」するには、デザインやコーディングの技術の他に、インターネットの仕組みや …