CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,

関連記事

[常時SSL化(2)]WordPressサイトの常時SSL化

WordPressは データベースの変更も必要になる 既存サイトの「作り」によって常時SSL化の難易度が異なる件は、「[常時SSL化(1)]Webサイトの常時SSL化」で述べたが、ここではWordPr …

no image

mixiのシステムダウン

一昨日から mixiのシステムダウンが断続的に発生している。 今朝になって復旧しているようだが。。。   こういう話を聞くと、元SEとして 現場技術者たちの奮闘ぶり、、というか、切羽詰まった現場の状況 …

メールアドレスの大文字/小文字は区別されるか!?

原則「区別される」が、大半のメールサーバーは区別なく運用 弊社で発行しているメルマガで、読者の方から「毎回2通届くので、1通だけにして」とご指摘がありました。 メルマガの配信は大手メール配信サービスを …

SSLv3脆弱性(POODLE)へのブラウザーでの対処方法

今度はSSLに関する脆弱性が発覚! ネット上の通信プロトコル(通信方法)の一種である「SSLv3」に脆弱性がみつかり、業界内(!?)では、かなり大きな騒ぎとなっている。 簡単に説明すると、SSLにより …

他社と契約したのに、、また相談に来るのはナゼ?

最近多い相談が。。。 最近しばしばあるケースなのですが、、 過去に、Webサイト制作やシステム構築の案件で、相見積もりとかで 競合他社と契約された(つまり うちが負けた)クライアントさんから、その後数 …