TEL

TRASPコラム

GoogleドライブでPDFや画像からテキストに変換!OCR機能

ビジネス

更新日:2022.02.03
公開日:2021.01.16

GoogleドライブのOCR機能で書類を電子テキストへ変換しよう

 

「画像データをテキストにしてデータベース化したい」

「PDFからテキストを抜き出して編集したい」

 

こういった場面はビジネスではよく見られます。

画像やPDFといったファイルからテキストを抽出するには「OCR(光学文字認識)」が使えるソフトウェアやWebサービスなどを利用する必要があります。

 

実は「Googleドライブ」にもOCR機能が搭載されているのをご存知でしょうか。

 

今回は、GoogleドライブのOCRを使う方法や精度、Googleドライブのメリットを初心者にもわかりやすく解説!
Googleドライブを持っていれば数ステップだけですぐにファイルからテキストを抜き出して表示可能です。

Web制作のプロであるTRASPが、企業のビジネスを円滑にすすめるための支援をいたします!

 

Googleの隠しコマンドについて解説した記事もあります。検索を楽にする方法やビジネスに役立つ裏ワザを紹介。

 

Googleドライブのメリットとは?

簡単!GoogleドライブのOCR機能で書類を電子テキストへ変換しよう

 

Googleドライブを利用している企業も多いと思います。

 

まずは、個人でも企業でも無料で使うことができるGoogleドライブのメリットをわかりやすく解説します!
「すでに知っている」「早くOCRの方法を知りたい!」という方は目次をクリックして先へお進みください。

Googleドライブとは?

Googleが提供しているオンラインストレージ。
Googleアカウントを持っていれば、パソコン上からWebブラウザーでアクセスして、すぐ利用できるようになります。

 

Googleドライブには、次のようなメリットがあります。

 

  1. 無料でOfficeサービスが利用できる
  2. Microsoft Officeにはない独自機能が搭載されている
  3. 15GBまで無料でデータを保存し放題
  4. その場ですぐファイル内容を共有可能
  5. アプリをインストールすればスマホでも使える
  6. 拡張性があり、課金するとさらに利便性が増す

順番に解説していきましょう。

1.無料でOfficeサービスが利用できる

Googleドライブには

 

  • 表計算ができるGoogleスプレッドシート
  • 文書作成ができるGoogleドキュメント
  • 資料作成に使えるGoogleスライド
  • アンケート作成に使えるGoogleフォーム

 

などが搭載されています。
特に「Googleスプレッドシート」や「Googleドキュメント」は簡単にURLで共有ができ、ビジネスの場でも役立つツールです。

 

各スプレッドシートやドキュメントなどで作ったファイルは、Googleドライブ内にリアルタイム保存されるため、いちいち「上書き保存」をせずともデータが紛失する心配がありません。オフライン上でも一時的にローカル上にデータが保存されて、オンラインになるとすぐオンライン保存されるのも便利ですね。

 

また、スプレッドシートやドキュメントで作成したファイルは「xlsx」や「docx」といった形式にも出力可能で、「Microsoft Office」といった他ソフトウェアでもすぐ利用できます。逆にMicrosoft OfficeなどのOfficeソフトウェアで作ったファイルをGoogleドライブで開いて編集することも可能です。

 

汎用性が高く活用範囲が広いのは、Googleドライブの大きなメリットです。

 

 

2.Microsoft Officeにはない独自機能

Googleドライブには、Microsoft Officeにはない独自機能が搭載されています。

 

たとえばショートカットキーも、Microsoft Officeにないものが多数使えます。
またGoogleスプレッドシートの場合は、URLから画像を自動表示するといった関数が利用可能。インターネット上からデータを収集しながらスプレッドシートを作成する際に活用可能です。

 

Googleドライブ内のOfficeソフトは、Microsoft Officeの単なる互換ソフトウェアではないのです。

 

このため独自の機能を理解しながら使うことで、Microsoft Officeとも連携しながらさまざまな使い方ができるようになり、作業効率が向上する可能性もあります。

 

 

3.15GBまで無料でデータを保存し放題

Googleドライブは15GBまで無料でデータを保存できます。

 

そのため少量のデータ保管だけで済む業種の場合は、無料プランだけでも十分ビジネスに活用可能。

 

15GBという容量は画像や動画を大量に保存しない限りなかなかなくならないので、ビジネス文書の管理がGoogleドライブ利用のメインになっている場合は気にする場面が少ないかと思います。

 

検索機能についても

 

  • 共有アイテムから他アカウントと共有しているフォルダ・ファイルを確認
  • 最近使用したアイテムから最新フォルダ・ファイルを確認
  • スター付きから重要なフォルダ・ファイルを確認
  • ゴミ箱から間違って削除したフォルダ・ファイルを探す
  • PDF、ドキュメントなどファイル形式から探す
  • 条件キーワードを入力して探す

 

といった豊富な機能が搭載されており、自分に合った方法ですぐ目的のファイルを探せるようになっているのもメリットです。

 

 

4.すぐファイル内容を共有可能

Googleドライブはクラウドサービスとして、他メンバーとのデータ共有についても強みがあります。

 

「ファイル」タブの「共有」メニューから、共有したいメールアカウントを選択してメッセージを沿えれば、すぐにアクセスURLが共有されます。またリンクをすれば、複数のメンバーにまとめてファイルを閲覧してもらうことも可能です。

 

編集可能、閲覧のみといった権限をその場で適切に付与しながら共有ができるのもメリット。
共有したアイテムはリアルタイムで編集が可能であり、権限を持っている方は他メンバーとメッセージのやり取りをしながらスムーズにデータを完成させられます。

 

 

5.アプリをインストールすればスマホでも使える

Googleドライブはパソコンだけのサービスではありません。
アプリをiPhoneやAndroidスマホなどにインストールすれば、スマホでも使えるようになります。Googleドライブアプリだけでも共有機能やコピーの作成、データのダウンロードなどが可能です。

 

さらにGoogleドキュメントアプリといった各種アプリを追加インストールすれば、スマホでもファイルを編集して作業ができるようになります。モバイルワークを導入している場合は、外出先でも簡単にデータ内容を確認して細かい訂正が可能。スマホなので根本的な編集作業には使いにくいですが、簡単な編集や内容確認などに使うには十分な機能でしょう。

 

 

6.拡張性があり、課金するとさらに利便性が増す

Googleドライブが無料版のままだと使いにくいと感じる場合は、課金をすれば機能が拡張されます。

 

具体的には

 

  • 100GB利用:250円/ユーザー/月
  • 200GB利用:380円/ユーザー/月
  • 2TB利用:1,300円/ユーザー/月
  • 10TB利用:1万3,000円/ユーザー/月
  • 20TB利用:2万6,000円/ユーザー/月
  • 30TB利用:3万9,000円/ユーザー/月

 

といったプランが用意されており、最大5人まで他メンバーを招待してストレージ容量を共有できるようになっています。

 

またGoogleのビジネス向けクラウドサービス「Google Workspace」へ登録すると、容量無制限も選べるように。
事業の規模に合わせて柔軟に容量を拡大したりできるのは、Googleドライブのメリットです。

 

 

OCR機能とは?特徴とメリット

簡単!GoogleドライブのOCR機能で書類を電子テキストへ変換しよう

 

OCR(光学文字認識機能)とは、「画像データやPDFなどのデータからテキストを抜き出して表示する」ための技術。現在では個人用途でも、OCRの利用範囲が増えています。

 

OCRの利用者が増加しているのは、精度向上が理由になっています。以前は

「テキストが記載されている箇所を指定する必要がある」

「テキストが活字である必要がある」

といった制限があり、利用には時間がかかる技術でした。
しかし現在では特に「AI(人工知能)」の活用により、テキストを自動判別して抜き出してくれるようになっています。また人間の手書きデータの学習により、くせのある文字にも対応できるようになりました。

 

今ではスマホアプリでも手軽にOCRを利用可能。
OCRツールを利用すると、次のようなメリットがあります。

 

  1. テキスト編集の手間を減らせる
  2. ペーパーレスを推進できる
  3. データの共有が簡単になり、属人化を防げる

 

 

1.テキスト編集の手間を減らせる

たとえば紙の資料を見ながら手入力する場合、1文字1文字正確に入力するのはストレスがかかります。
また単純作業なので時間も無駄になるのがネックです。

 

しかしOCRを使えば、まず自動で文字起こしをした後に、おかしな箇所のみ編集するだけで文字起こしが完了。

 

普段の作業にOCR作業を取り入れるだけで、作業工数が一気に減って作業効率化にも効果があります。
空いた時間はより重要な作業に回せるので会社の収益改善にもつながるのがポイントでしょう。

 

 

2.ペーパーレスを推進できる

OCRで紙の書類をデジタルデータ化すると、あらゆる書類をパソコンやスマホなどで簡単に管理して取り出せるようになり、「ペーパーレス」を推進できます。

 

ペーパーレスは政府も積極的に取り組んでいる施策であり、紙のやり取りをなくしてコストを削減しながら、デジタル上で簡単にデータを管理できるようにするのが目的。ペーパーレスの先にはデジタル基盤でビジネスや組織が動くようになる「DX(デジタルトランスフォーメーション)」があります。

 

DXの第一歩として、OCRによる紙書類のデジタル化は大きな効果をもたらすのがポイントです。
将来的には最初からデジタルデータで全部の書類を管理できるようになるのが好ましいですが、現時点では紙書類をデジタルデータにしながら効率のよい管理を目指すのが現実的です。

 

 

3.データの共有が簡単になり、属人化を防げる

OCRにして紙の書類をデジタルデータ化すると、データの共有が簡単になります。
パソコンやスマホから検索をするだけで、誰でもすぐ該当の情報にアクセスできるようになるのがポイントです。

紙の書類ベースのデメリット・危険性

「指定の人だけ書類を持っており、会社を辞めたとたんに場所が分からなくなり活用できない」というトラブルが発生する可能性。

紙の書類を資産として考えると、情報が失われるのは会社の業績にも悪影響を与えてしまいます。

しかしOCRで紙の書類をデジタル化しておくと、万が一書類自体がなくなってもデジタルでデータが残っているので資産が消えません。誰でも簡単に書類へアクセスできるようにすることで作業が平準化され、むらがなくなります。

 

 

GoogleドライブでOCRを使う方法3ステップ

GoogleドライブでOCRを使う方法

 

ここからは実際に、GoogleドライブでOCRを使う方法を解説していきます。

 

  1. OCRでスキャンしたいファイルを用意する
  2. Googleドライブから該当のファイルを探してドキュメントで開く
  3. 結果を確認する

 

1.OCRでテキスト化したいファイルを用意する

まずはOCRでテキスト化したいファイルを用意します。

 

1.OCRでスキャンしたいファイルを用意する

 

用意ができたらGoogleドライブに、指定のファイルをアップロードしてください。

 

2.ファイルをドキュメント化

次に、ステップ1でアップロードしたファイルを右クリック。

 

「アプリで開く」→「Googleドキュメント」とたどってください。

 

1.OCRでスキャンしたいファイルを用意する

 

Googleドキュメントをクリックすると、自動でOCR検出が始まります。

 

画像のデータ容量や内容、インターネット接続状況などに応じては検出に時間が掛かる可能性がありますが、ゆっくり慌てずに待ちましょう。

 

 

3.結果を確認する

最後に検出された結果がGoogleドキュメントで表示されるので、結果を確認してみます。

 

1.OCRでスキャンしたいファイルを用意する

 

画像からOCRでテキストを抽出した場合は、上記画像のようにまず画像が上部に表示され、それから下部に抜き出したテキストの内容が表示されるようになっています。

 

どの原本にOCRをかけたかが分かるので便利です。
そのままテキストを編集して保存して、検索できるように準備するのもよいでしょう。

 

 

GoogleドライブのOCR性能を検証

簡単!GoogleドライブのOCR機能で書類を電子テキストへ変換しよう

 

ここからはGoogleドライブのOCR機能でどこまで文字を抜き出せるのか、検証を行っていきます。

 

  • 横書きのテキスト
  • 縦書きのテキスト
  • ビジュアル要素付きのテキスト
  • 手書きのテキスト
  • 表のテキスト

 

 

横書きのテキスト

「OCR
テスト」

という横書きのテキストを、OCR機能でテキスト抽出してみると次のようになります。

簡単!GoogleドライブのOCR機能で書類を電子テキストへ変換しよう

元の画像では改行していましたが、OCRでテキスト化すると1行にまとまってしまいました。

しかし文字についてはすべてきれいに抜き出せており、精度は100%です。

 

 

縦書きのテキスト 

GoogleドライブのOCR性能は?どこまでテキストを抜き出せるか検証

日本語では縦書きのテキスト画像データもよく見ます。
実際にGoogleドライブで縦書きのテキストを読み取ってみると、次のような結果になりました。

GoogleドライブのOCR性能は?どこまでテキストを抜き出せるか検証

ほぼ正確に読み取れていますが、注意したいのは縦書きから横書きへ変換されてしまう点

 

Googleドライブでは縦書き機能が現在搭載されておらず、縦書き文書をOCRでテキスト抽出した場合は自動で横書き表示になってしまいます。したがってGoogleドライブでいったん横書き表示として抜き出した後、無料のツールで縦書き表示にテキストを直したりという手間が発生します。

 

ビジュアル要素付きのテキスト

次は、文字だけではなくビジュアル要素つきの画像からテキストを直接抜き出してみます。

 

GoogleドライブのOCR性能は?どこまでテキストを抜き出せるか検証

無料素材サービスでダウンロードした、ビジネス単語が散りばめられた画像です。

 

GoogleドライブのOCR性能は?どこまでテキストを抜き出せるか検証

 

結果としては、ほぼすべての文字が抽出できました。
色つきで表示されているのが印象的ですね。

これだけでも、GoogleのOCRの精度の高さがわかると思います。

 

ビジュアル要素付きのテキストも簡単に抜き出せますが、

  • 色が含まれている場合はテキストも色付き表示される
  • 小さい文字は判読できずに表記が違ったり抜けたりする点

などに注意して使うとよいでしょう。

 

 

手書きのテキスト

GoogleドライブのOCR性能は?どこまでテキストを抜き出せるか検証

 

次に、手書きのテキストをOCR抽出していきます。

 

GoogleドライブのOCR性能は?どこまでテキストを抜き出せるか検証

残念ながら日本語の部分は抜き出せませんでしたが、英語の部分は正確にテキスト化できています。

手書きの文字は、ものによるのかもしれませんね。

 

 

表のテキスト

次は表のテキスト。
Googleドキュメントで作った表を画像にして、OCRで抜き出してみます。

 

GoogleドライブのOCR性能を検証

 

結果としては、残念ながら、1文字も抜き出せませんでした。

 

結果が表示されるエリアは空白でした。表の線が邪魔をしている可能性もあります。グレー反転しているのが原因かと思い、反転なしでもう一度OCRに掛けましたが、結果は同じでした。

 

GoogleドライブOCR変換する画像に表が入っている場合は、テキストがきれいに抜き出せているかしっかり確認しておきましょう。

 

 

GoogleドライブOCRは画像から文字を検索できる

画像やPDFの自動認識にも対応!GoogleドライブOCR

 

GoogleドライブのOCR機能は、画像やPDFをテキストに変換するだけではありません。
画像やPDFの検索にも対応しているのがポイントです。

 

たとえば「NATURAL BOTANICAL」と検索をすると、先ほどの「GoogleドライブのOCR性能を検証」の章で使った、手書きのイラスト画像がヒットします。

 

画像やPDFの自動認識にも対応!GoogleドライブOCR

 

OCR変換後のテキストだけでなく、元の画像も検索結果に表示されている点に注目。
つまり画像からテキストに変換する作業を行わなくても、Googleドライブに画像をアップロードした時点でOCRの自動認識を使って画像のなかの文字を判別していたということになります。

 

たとえば、

「以前行ったお店の、看板やメニューをスマホで撮影した写真がなかなか見つからない…」

「資料をスキャンしたが、整理できていない」

といった場合に、Googleドライブへアップロードし、文字で検索すれば見つけることができるのです。

 

具体的にビジネスにおいて活用できる場面

  • もらった名刺を撮影し、Googleドライブに保存。名前が思い出せなくても「〇〇開発」や企業名の一部でも検索可能。
  • 会議での決定事項が書かれたホワイトボードを写真に撮り、 Google ドライブに保存。共有すれば社員が閲覧・検索することができるため、議事録を作成する工数を削減できる。

フォルダに画像やPDFを整理するだけで、ビジネスにおいてさまざまな活用が期待できます。
Googleドライブの真価は、検索機能にこそあるのかもしれません。

 

 

Googleドライブ以外の「OCRサービス」11選

簡単!GoogleドライブのOCR機能で書類を電子テキストへ変換しよう

 

ここからは、Googleドライブ以外にもビジネスに活用できるOCRサービスをまとめていきます。

 

  1. Evernote
  2. OneNote
  3. Adobe Acrobat DC
  4. 読取革命
  5. Free Online OCR
  6. Convertio
  7. LINE
  8. OfficeLens
  9. Adobe Scan
  10. Google Keep
  11. ClipOCR

 

1.Evernote

Evernote

Evernote

 

電子ノートとして代表的な「Evernote」には、文章として認識したデータを自動で判別してOCR処理してくれる機能が搭載されています。

 

テキストだけでなく、画像、音声、スキャン、PDF、文書ファイルをアップロード可能。
ノート、タスク、スケジュールをまとめて管理できるので、便利です。

 

ただしファイルを編集したいときには、Googleドライブといった他社サービスを利用する必要がある点に注意してください。

 

 

2.OneNote

OneNote

OneNote

 

「OneNote」はMicrosoft社が提供する電子ノートサービスです。

 

画像を貼り付け、「画像からテキストをコピー」メニューをクリックすると、画像の下に文字が抜き出されて表示されます。仕組みとしてはGoogleドライブに似ていますね

 

「Microsoft Officeなどと連携させながらOCR機能を使いたい」
という場合は、Microsoft社純正のOneNoteのほうが利用に向いているでしょう。

 

 

3.Adobe Acrobat DC

Adobe Acrobat DC

Adobe Acrobat DC

 

「Adobe Acrobat DC」は、PDF開発元の「Adobe」公式のPDF編集・閲覧用ソフトウェアです。

 

クリックだけでPDFからテキストを認識できる点が高ポイント。
カスタムフォントを利用したテキストの追加など、高度なPDF編集機能も備わっています。

 

「PDFを編集する機会が多い」という方にはおすすめできるソフトウェアです。

 

 

4.読取革命

読取革命

読取革命

 

OCR読み取りに特化したソフトウェアです。
オリジナルの読み取り辞書データベースなどを利用して文字を抜き出す仕組みになっており、

  • 訂正線付きの文字
  • 影が付いている文字
  • 下線が付いている文字
  • くせのある手書き文字

 

など各種文字を、プレーンテキストとして認識し、取り出せます。
また「PDF書類のレイアウトのまま、Excelへ書類を変換する」といった用途にも使えるのがポイントです。

 

GoogleドライブといったサービスではOCR機能が限定的ですが、有料であるぶん安定して文字を抜き出して活用できるのがメリット。Googleドライブとの併用もおすすめ。
「本格的に紙書類をデジタル化してペーパーレスを実現したい」
という方にはぴったりです。

 

 

5.Free Online OCR

Free Online OCR

Free Online OCR

Free Online OCR

 

無料で使えるWebサービスです。
日本語だけでなく、中国語といった世界46の言語に対応している幅広さもポイント。

  1. ファイルをアップロードする
  2. 言語を選択する
  3. 出力形式を選択する
  4. コンバートボタンを押す

 

といった簡単なステップだけで、すぐ画像やPDFなどからテキストを抜き出せます。

 

さらにアカウントを作って登録を行うと、

  • 複数ページのPDFを変換
  • 大きな画像
  • その他の設定を操作できる

 

といった機能が解放されるので、より使いやすくなるのがメリットです。
「無料で多彩な機能のあるOCRサービスを使いたい」という方はぜひ使ってみましょう。

 

 

6.Convertio

Convertio

Convertio

 

10ファイルまで無料でOCR機能を利用可能。
サインアップして利用すれば、もっと多くのファイルをコンバートして使えるようになります。

 

Googleドライブや「Dropbox」と連携させることで、パソコン上にファイルがなくても、その場でファイルをアップロードして変換できるのがメリットです。また

 

  • .doc
  • .xlsx
  • .pptx
  • .txt

 

といった各ファイル形式に幅広く対応しているので、使いやすいのもポイントです。

 

 

7.LINE

LINEはメッセージツールとして有名ですが、他にも

  • LINE Payで支払いができる
  • ビデオ会議ができる
  • 家計簿を付けられる
  • QRコードを読み取ってWebサイトを表示できる

 

といったように多彩な機能を備えています。そして、OCR機能にも対応しています。

 

LINE上に画像を貼り付け、テキスト化する文章を範囲指定すると、自動でテキストに変換されて表示されます。
また英語の場合は、日本語に翻訳できる機能も備わっています。

 

「いつも使っているLINEで手軽にOCRを使いたい」という場合は、今すぐ試してみましょう。

 

 

8.OfficeLens

OfficeLens

OfficeLens

 

スマホアプリとして有名なOCRアプリが「OfficeLens」です。
読み取り精度はアプリの中でもトップクラスで、無料で使える手軽さも人気を集めています。

 

スマホカメラで撮影した写真から、その場でOCR機能を使ってテキストを抜き出せます。
ホワイトボードの手書き文字なども認識可能で、

 

  • PDF
  • Word
  • PowerPoint

 

などへ変換した後、OneDriveなどに保存できる機能も便利です。

 

検索の際も画像内の文字が自動認識され、検索結果にヒットするので効率的です。
Microsoftサービスを頻繁に使っている場合は利用したほうがよいでしょう。

 

 

9.Adobe Scan

Adobe Scan

Adobe Scan

 

Adobeの公式OCRスキャンアプリです。無料ですぐに使えます

  • スキャンしたページをJPEGとして保存
  • 書類のシミといったノイズデータを除去
  • スキャンの色彩補正が可能

 

といった多彩な機能を備えており、利便性が高いのが特徴です。

 

またスキャンしてPDFにしたデータは「Adobe Document Cloud」上で共有して、すぐ編集ができるのもポイントになっています。

 

 

10.Google Keep

Google Keep

Google Keep

 

Google純正のメモアプリ「Google Keep」にもOCR機能が搭載されています

 

Googleドライブと認識レベルは同じかもしれませんが、スマホだとアプリ上から細かいGoogleドライブの機能を呼び出すのは難しいです。Google Keepがあるとその場でメモを取ってOCR化、テキストとして利用するといった使い方もできます

 

Googleドライブの補助としてインストールしておいても損はありません。

 

 

11.ClipOCR

ClipOCR

ClipOCR

 

縦書きについてもOCR認識ができる便利なアプリです。

 

人工知能搭載が特徴的で、読み取りたい部分を指定する手間はかかりますが、ピンポイントに文字の読み取りが可能です。
フォルダ機能は搭載されていませんが、ファイル名を一覧から変更して分かりやすく整理することは可能になっています。

 

 

まとめ

今回はGoogleドライブの使い方について、OCR機能の使い方、ほかのOCRサービス・アプリもご紹介してきました。

 

GoogleドライブのOCR機能は、簡単なテキスト抜き出しなどには十分利用できます。
また自動で文字を判別し、画像から検索可能な高度な機能も便利です。

 

Googleドライブ以外にもたくさんのOCRWebサービス・アプリが存在します。
自分に合ったOCRアプリを実際に試しながら探して、ビジネスをペーパーレスに進めてみてください。

 

TRASPはさまざまな企業をWebで支援してきました。
お気軽にお問い合わせください。

 

お問い合わせはこちら

タグ

CONTACTweb制作やweb集客のご相談やお見積もりなど

WEBサイト無料診断
WEBサイト無料診断
© TRASP.inc All Rights Reserved.