CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

[要注意]佐川急便を装ったスパムメール

スパムもだんだん巧妙化している 佐川急便から「[佐川急便] 請求内容確定のご案内」なるメールが届いた。 佐川急便は利用することもあるし、アカウントも持っているので こういったメールが届いても不思議では …

テレワーク、本格導入にあたって考慮したこと

これをきっかけにテレワーク化が一気に進むか 新型コロナウィルス感染対策として、当社でもテレワークを本格導入した。 どちらかと言うと自分は、今まで リモート会議システムなどを使った取引先との打合せにも消 …

[備忘録]WordPressの常時SSL化でBizVektorテンプレートの対応

[常時SSL化(3)]WordPress:BizVektorの落とし穴 常時SSL化については、下記ブログで述べてきたが、 ・[常時SSL化(1)]Webサイトの常時SSL化 ・[常時SSL化(2)] …

no image

[SNS]Twitterに携帯からメールで投稿する方法

「つぶやき」と言うくらいだから、出先で遭遇したモロモロをつぶやきたい、、ということで、ケータイから投稿できるサービスを使ってみた。 いろいろあるようだが、、ワタシは「Twittermail」という無料 …

WordPressの落とし穴:「.htaccess」が勝手に書き換わる!

知らぬ間に編集した内容が消えていた。。 WordPressを使ってサイトを構築している場合、「.htaccess」を使ってサイトの設定等をコントロールすることがある。 しかし、ある日突然 設定していた …