CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

拒否してもまだ送り続ける迷惑メール。。

世界中のメールうち70%はスパムメール! 仕事柄メールは毎日たくさんくる。 あまり頻繁に来る迷惑メールとかは、プロバイダーのフィルター機能で「受信拒否設定」するようにしているので、一時期よりはだいぶ減 …

サーバーや技術的な社内勉強会を開催しました。

意外と奥が深いサーバー関連の技術的なノウハウ 今週の月曜日、社内でサーバーや技術的な勉強会を開催しました。 「Webサイトを公開」するには、デザインやコーディングの技術の他に、インターネットの仕組みや …

Gmailが日本語アドレスに対応!日本語メルアドによるシステムへの影響を考える

ご存じGoogleの提供するメールサービス「Gmail」。ちょうど一ヶ月くらい前、Googleが「Gmailが日本語などアルファベット以外文字を含むメールアドレスとの送受信に対応する」と発表した。 わ …

SSLv3脆弱性(POODLE)へのブラウザーでの対処方法

今度はSSLに関する脆弱性が発覚! ネット上の通信プロトコル(通信方法)の一種である「SSLv3」に脆弱性がみつかり、業界内(!?)では、かなり大きな騒ぎとなっている。 簡単に説明すると、SSLにより …

簡単多言語化:WebサイトにGoogle翻訳を埋め込む方法

完璧ではないが、そこそこ意味は通じる ※2021.03.29追記  本方法は、Google Translateが新規登録を終了しています。。  代替案は > https://attrise.blog/ …