CEOブログ

横浜で活躍するホームページ作成・開発会社アットライズの代表取締役社長(CEO)が綴る、日々の奮闘記!!

業界・技術情報

Google 次から次へと。。

投稿日:2008年11月1日 更新日:

毎日のように新しいサービス、技術をリリースしてくるGoogleだが、、
また新しい技術が公開された!
 

http://markezine.jp/article/detail/5822

 
紙の文章をスキャニングしてPDF化した文章(正確には画像)も、OCRで認識し検索可能にする、というモノ。
 
「そこまでやるか!?」とい気もするが、あらゆる書籍をデータ化しようとしているGoogleなら、そのくらいやっても不思議ではないか。。
 
OCRというと認識率が課題だったりするが、例えば「O(オー)」なのか「0(ゼロ)」なのかを判別するらしいので、単に一文字一文字を機械的に読むだけでなく、前後の文脈も判断するアルゴリズムが組み込まれている、ということか。
 
記事を見る限り、さすがにまだ英数字の文章のみのようだが、、これで日本語にも対応したらスゴイですな。
 
 

-業界・技術情報
-,


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

新たな脆弱性、あなたのWebサーバーは大丈夫!?

コンピュータ、ネットワーク機器に脆弱性が見つかるたびに、その対処などのフォローが必要になる。。 Windowsの場合は、「Windows Update」というプログラムで自動的に対処ファイルがインスト …

またまた、、WordPressに深刻な脆弱性

今度は「深刻な」との前置き付き。。 WordPressの脆弱性については10/2のブログ(WordPressの脆弱性への対応)でも書きましたが、またまた脆弱性が発覚しました。 しかも今度は「深刻な」と …

地域名ドメイン「.yokohama」いよいよ一般登録開始!

サイトのURLやメールアドレスで使うドメインは、「.com」や「.co.jp」などがお馴染みですが、地域名のドメイン(正式には「地理的名称トップレベルドメイン(地域名TLD)」と言う)が、メジャーな都 …

no image

mixiのシステムダウン

一昨日から mixiのシステムダウンが断続的に発生している。 今朝になって復旧しているようだが。。。   こういう話を聞くと、元SEとして 現場技術者たちの奮闘ぶり、、というか、切羽詰まった現場の状況 …

会議を録音し、10分後にはChatGPT・生成AIで「要約」が完成!

「CLOVA Note」と「ChatGPT」で実現! 先日のこと、 5人での社内会議で「議事録のメモ、よろしくね」と言ったら、「だったらAIにやらせてみては!?」との提案で、早速試してみることに。   …