音声ブラウザ向けページ内リンク

本文へ進みます

メインナビゲーションへ進みます

ページナビベーションへ進みます

音声ブラウザ向けリンク終了

しんしょう協会 (北九州市身体障害者福祉協会)

ここから本文です。

「できない」を「できる」に変える技術

光学的(こうがくてき)文字(もじ)認識(にんしき)(OCR)とは、印刷された活字や画像をスキャナやデジタルカメラで読みとって、デジタルの文字コードに変換する技術のことです。

視覚に障害のある人は、活字や画像を文字コードに変換、データ化することで、パソコンやスマートフォンの音声読み上げ機能を使って、印刷物の情報を得ることができるようになります。

近年、このOCRの発展が目覚ましく、視覚に障害のある人にとって便利な機器やアプリが数多く開発されています。(*OCRはOptical Character Recognitionの略)

今回はその中から体験した2つの製品をご紹介します。

まずは、メガネに簡単に取り付けられる音声デバイス「オーカム」です。

オーカムは、書類をメガネの正面にくるように手に取り、デバイス本体を1回指でタッチするだけで、カメラが画像を解析(かいせき)し、書類の内容を音声で読み上げてくれます。また、途中の見出し部分を人差し指でさし、音が鳴ったら指を放すだけで、見出し部分から音声で読み上げてくれます。書類のように手に取れなくても、遠くの看板の文字を人差し指でさして読ませることもできます。

今回体験した「オーカム」は「マイリーダー」という機種で、書類、メール、資料などの活字を解析し、音声で読上げてくれるデバイスです。上位機種の「マイアイ」になると、書類などに加え、あらかじめデバイスに学習させた人の顔、またお札や色、商品のバーコードの認識ができるようになります。

次に体験したのは、スマートフォンのアプリ「Envision AI(エンビジョン エーアイ)」です。

これは、カメラでとらえた文字情報を読上げる機能を持つアプリです。操作は簡単で、アプリを立ち上げて、目の前の情報をすぐに読上げてほしいときは「すぐに認識してほしい文字」のアイコンをタップするだけ。そうすると、カメラでとらえた範囲にある文字情報を読上げてくれますので、例えば自動販売機などで商品名や値段を確認したいとき、冷蔵庫の中の商品のパッケージを読ませて、何の商品か確認したいときなどに使えます。

また、書類を解析して文字情報として読ませたいときは「書類の文字」のアイコンを選んでタップするし、カメラと書類の距離をうまく調節して、書類が画(が)角(かく)に収まるようにすれば、書類の文字情報をテキストとして抜き出し、音声で読み上げてくれます。

エンビジョンは、その他に風景や色の説明、バーコードのスキャンなどの機能が備わっています。

今回2つの製品を紹介しましたが、他にもたくさんのOCR機能を持つ機器やアプリがあります。

カメラでとらえた文字を完璧に読上げるとまではなかなかいきませんが、自宅に届いた手紙は一人では読めず、ヘルパーが来た時に読んでもらうしかない、点字シールが貼っていない自動販売機では何が並んでいるか分からず買えないなどの、これまでの「できない」を「できる」に変える技術が詰まったOCRは、今後の多くの可能性を秘めています。皆さんもぜひ一度体験してみてください。

直前ページに戻る

ここまで本文です。

ここからページナビゲーションです。

ここまでページナビゲーションです。