即テキスト化!Googleドライブを使って画像から文字起こし(OCR)してみました

こんにちは。アイニチスタッフの柳です。


毎日暑いですね!早くも各地で真夏日を記録したそうです。今年の夏は何度まで気温が上がるんでしょうか。

 

毎日暑いですね!

 

 

先日、自宅で仕事をしていた妻が、PDFデータ内に書かれた文字をテキストに書き起こしていました。


大して量がなかったので、そのままでも良かったのですが、せっかくなので、私の方でツールを探してみました。

 

以前の記事でも紹介した「Googleドライブ」で、今回はOCRという技術を使用していきます。

 

ainichi.hatenadiary.com

 

OCRとは

OCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)とは、手書きや印刷された文字を、イメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術

https://mediadrive.jp/technology/ocr.html

例をあげれば、画像ファイルを読み取って、テキストに変換させるものなどがあります。

 

OCRを使用したサービスやアプリはかなり前からありますが、今回は無料かつ使いやすいものを選びました。

 

使い方

それでは早速、Googleドライブを使用して、画像の文字をテキスト化していきたいと思います。

 

ステップ1

googleドライブを立ち上げます。(画像はchormeの場合)
まずはGoogleドライブを立ち上げます。(画像はChromeの場合)

 

ステップ2

文字起こししたいファイルをアップロードします。
左上にある「新規ボタン」をクリックし、文字起こししたいファイルをアップロードします。

 

ステップ3

アップロードしたファイルを右クリックし、「googleドキュメント」を選択します。
アップロードしたものが「ファイル」に追加されてから、該当ファイルを右クリックして、「アプリで開く」から「Googleドキュメント」を選択します。

 

ステップ4

「ファイル」にテキスト化された新しいGoogleドキュメントが追加されます。

 

データ量が多いと、作成されるまで少し時間がかかりますが、たったこれだけのステップで画像の文字起こしができます。

 

Googleドライブの公式ヘルプで詳しい条件が指定されているので、一部抜粋します。詳しくはリンク先も見てみてください。

 

  • 形式:JPEGPNG、GIF、PDF
  • ファイルサイズ: ファイルは 2 MB
  • 解像度: テキストの高さは 10 ピクセル以上

PDF や写真のファイルをテキストに変換する - パソコン - Google ドライブ ヘルプ

 

それでは、次は精度を見ていきたいと思います。実際にテキスト化したものをいくつかのパターンに分けてみました。

 

精度

チラシの場合

弊社で使用している空き缶潰し機のチラシを参考に、実物と文字起こししたものを比較してみます。

 

実際のチラシ

実際のチラシ

 

文字起こし後

チラシの文字起こし後

 

ざっくり言うと、文字組みや強調文字などは崩れていますが、テキスト自体は抜き出せています。(上の画像は途中で切っているので、実際のテキストはまだ続きがあります)

 

パンフレットの場合

こちらも弊社で使用しているパンフレットの1ページです。テキスト化の精度を見るため、文字の多い法律解説ページを選びました。

 

実際のパンフレット

実際のパンフレット

 

文字起こし後

パンフレットの文字起こし後
こちらも文字組みなどは崩れてますが、文字自体はある程度抜き出せていました。チラシと同様に、文字起こし後の画像は途中で切っています。

 

アンケートの場合

最後は、お客様にお送りしているアンケート用紙です。(アンケート内容は、私がテストで記入しています)

 

実際のアンケート

実際のアンケート

 

文字起こし後

文字起こし後のアンケート

打ち込まれた文字はテキスト化されていますが、手書きはきちんと書き起こされませんでした。もちろん、レ点(チェックマーク)なども反映されていません。

 

その他の使い方

今回の用途以外にも色々な使い方ができます。簡単にご紹介しておきます。

 

先ほどの機能を使い、名刺管理する方法が紹介されています。

k-tai.watch.impress.co.jp

 

GoogleKeepを使用すれば、PCではなくアプリからでも文字起こしができます。

hokoxjouhou.blog105.fc2.com

 

まとめ

いくつかのパターンで文字起こししてみました。総評としては、用途を限定すれば使えるといった感じです。

 

例えば、文字起こしが必要な際、一からでは手間がかかるので一度Googleドライブで、ざっくりとテキスト化と配置をした後で、最終校正していくという流れなら、時間短縮に十分役立ってくれそうです。

 

今回の方法も元画像が良ければ、文字起こしのクオリティが高まるかもしれません。また、今後この技術の精度が高くなれば、さらに手間なく進められるようになるでしょう。