その他
「ノーコード(NoCode)」とは?市場規模・・・
2021.01.06
TRASPコラム
その他
更新日:2023.03.30
公開日:2021.01.16
「画像データをテキストにしてデータベース化したい」
「PDFからテキストを抜き出して編集したい」
こういった場面はビジネスではよく見られます。
画像やPDFといったファイルからテキストを抽出するには「OCR(光学文字認識)」が使えるソフトウェアやWebサービスなどを利用する必要があります。
実は「Googleドライブ」にもOCR機能が搭載されているのをご存知でしょうか。
今回は、GoogleドライブのOCRを使う方法や精度、Googleドライブのメリットを初心者にもわかりやすく解説!
Googleドライブを持っていれば数ステップだけですぐにファイルからテキストを抜き出して表示可能です。
Web制作のプロであるTRASPが、企業のビジネスを円滑にすすめるための支援をいたします!
Googleの隠しコマンドについて解説した記事もあります。検索を楽にする方法やビジネスに役立つ裏ワザを紹介。
目次
Googleドライブを利用している企業も多いと思います。
まずは、個人でも企業でも無料で使うことができるGoogleドライブのメリットをわかりやすく解説します!
「すでに知っている」「早くOCRの方法を知りたい!」という方は目次をクリックして先へお進みください。
Googleドライブとは?
Googleが提供しているオンラインストレージ。
Googleアカウントを持っていれば、パソコン上からWebブラウザーでアクセスして、すぐ利用できるようになります。
Googleドライブには、次のようなメリットがあります。
順番に解説していきましょう。
Googleドライブには
などが搭載されています。
特に「Googleスプレッドシート」や「Googleドキュメント」は簡単にURLで共有ができ、ビジネスの場でも役立つツールです。
各スプレッドシートやドキュメントなどで作ったファイルは、Googleドライブ内にリアルタイム保存されるため、いちいち「上書き保存」をせずともデータが紛失する心配がありません。オフライン上でも一時的にローカル上にデータが保存されて、オンラインになるとすぐオンライン保存されるのも便利ですね。
また、スプレッドシートやドキュメントで作成したファイルは「xlsx」や「docx」といった形式にも出力可能で、「Microsoft Office」といった他ソフトウェアでもすぐ利用できます。逆にMicrosoft OfficeなどのOfficeソフトウェアで作ったファイルをGoogleドライブで開いて編集することも可能です。
汎用性が高く活用範囲が広いのは、Googleドライブの大きなメリットです。
Googleドライブには、Microsoft Officeにはない独自機能が搭載されています。
たとえばショートカットキーも、Microsoft Officeにないものが多数使えます。
またGoogleスプレッドシートの場合は、URLから画像を自動表示するといった関数が利用可能。インターネット上からデータを収集しながらスプレッドシートを作成する際に活用可能です。
Googleドライブ内のOfficeソフトは、Microsoft Officeの単なる互換ソフトウェアではないのです。
このため独自の機能を理解しながら使うことで、Microsoft Officeとも連携しながらさまざまな使い方ができるようになり、作業効率が向上する可能性もあります。
Googleドライブは15GBまで無料でデータを保存できます。
そのため少量のデータ保管だけで済む業種の場合は、無料プランだけでも十分ビジネスに活用可能。
15GBという容量は画像や動画を大量に保存しない限りなかなかなくならないので、ビジネス文書の管理がGoogleドライブ利用のメインになっている場合は気にする場面が少ないかと思います。
検索機能についても
といった豊富な機能が搭載されており、自分に合った方法ですぐ目的のファイルを探せるようになっているのもメリットです。
Googleドライブはクラウドサービスとして、他メンバーとのデータ共有についても強みがあります。
「ファイル」タブの「共有」メニューから、共有したいメールアカウントを選択してメッセージを沿えれば、すぐにアクセスURLが共有されます。またリンクをすれば、複数のメンバーにまとめてファイルを閲覧してもらうことも可能です。
編集可能、閲覧のみといった権限をその場で適切に付与しながら共有ができるのもメリット。
共有したアイテムはリアルタイムで編集が可能であり、権限を持っている方は他メンバーとメッセージのやり取りをしながらスムーズにデータを完成させられます。
Googleドライブはパソコンだけのサービスではありません。
アプリをiPhoneやAndroidスマホなどにインストールすれば、スマホでも使えるようになります。Googleドライブアプリだけでも共有機能やコピーの作成、データのダウンロードなどが可能です。
さらにGoogleドキュメントアプリといった各種アプリを追加インストールすれば、スマホでもファイルを編集して作業ができるようになります。モバイルワークを導入している場合は、外出先でも簡単にデータ内容を確認して細かい訂正が可能。スマホなので根本的な編集作業には使いにくいですが、簡単な編集や内容確認などに使うには十分な機能でしょう。
Googleドライブが無料版のままだと使いにくいと感じる場合は、課金をすれば機能が拡張されます。
具体的には
といったプランが用意されており、最大5人まで他メンバーを招待してストレージ容量を共有できるようになっています。
またGoogleのビジネス向けクラウドサービス「Google Workspace」へ登録すると、容量無制限も選べるように。
事業の規模に合わせて柔軟に容量を拡大したりできるのは、Googleドライブのメリットです。
OCR(光学文字認識機能)とは、「画像データやPDFなどのデータからテキストを抜き出して表示する」ための技術。現在では個人用途でも、OCRの利用範囲が増えています。
OCRの利用者が増加しているのは、精度向上が理由になっています。以前は
「テキストが記載されている箇所を指定する必要がある」
「テキストが活字である必要がある」
といった制限があり、利用には時間がかかる技術でした。
しかし現在では特に「AI(人工知能)」の活用により、テキストを自動判別して抜き出してくれるようになっています。また人間の手書きデータの学習により、くせのある文字にも対応できるようになりました。
今ではスマホアプリでも手軽にOCRを利用可能。
OCRツールを利用すると、次のようなメリットがあります。
たとえば紙の資料を見ながら手入力する場合、1文字1文字正確に入力するのはストレスがかかります。
また単純作業なので時間も無駄になるのがネックです。
しかしOCRを使えば、まず自動で文字起こしをした後に、おかしな箇所のみ編集するだけで文字起こしが完了。
普段の作業にOCR作業を取り入れるだけで、作業工数が一気に減って作業効率化にも効果があります。
空いた時間はより重要な作業に回せるので会社の収益改善にもつながるのがポイントでしょう。
OCRで紙の書類をデジタルデータ化すると、あらゆる書類をパソコンやスマホなどで簡単に管理して取り出せるようになり、「ペーパーレス」を推進できます。
ペーパーレスは政府も積極的に取り組んでいる施策であり、紙のやり取りをなくしてコストを削減しながら、デジタル上で簡単にデータを管理できるようにするのが目的。ペーパーレスの先にはデジタル基盤でビジネスや組織が動くようになる「DX(デジタルトランスフォーメーション)」があります。
DXの第一歩として、OCRによる紙書類のデジタル化は大きな効果をもたらすのがポイントです。
将来的には最初からデジタルデータで全部の書類を管理できるようになるのが好ましいですが、現時点では紙書類をデジタルデータにしながら効率のよい管理を目指すのが現実的です。
OCRにして紙の書類をデジタルデータ化すると、データの共有が簡単になります。
パソコンやスマホから検索をするだけで、誰でもすぐ該当の情報にアクセスできるようになるのがポイントです。
紙の書類ベースのデメリット・危険性
「指定の人だけ書類を持っており、会社を辞めたとたんに場所が分からなくなり活用できない」というトラブルが発生する可能性。
紙の書類を資産として考えると、情報が失われるのは会社の業績にも悪影響を与えてしまいます。
しかしOCRで紙の書類をデジタル化しておくと、万が一書類自体がなくなってもデジタルでデータが残っているので資産が消えません。誰でも簡単に書類へアクセスできるようにすることで作業が平準化され、むらがなくなります。
ここからは実際に、GoogleドライブでOCRを使う方法を解説していきます。
まずはOCRでテキスト化したいファイルを用意します。
用意ができたらGoogleドライブに、指定のファイルをアップロードしてください。
次に、ステップ1でアップロードしたファイルを右クリック。
「アプリで開く」→「Googleドキュメント」とたどってください。
Googleドキュメントをクリックすると、自動でOCR検出が始まります。
画像のデータ容量や内容、インターネット接続状況などに応じては検出に時間が掛かる可能性がありますが、ゆっくり慌てずに待ちましょう。
最後に検出された結果がGoogleドキュメントで表示されるので、結果を確認してみます。
画像からOCRでテキストを抽出した場合は、上記画像のようにまず画像が上部に表示され、それから下部に抜き出したテキストの内容が表示されるようになっています。
どの原本にOCRをかけたかが分かるので便利です。
そのままテキストを編集して保存して、検索できるように準備するのもよいでしょう。
ここからはGoogleドライブのOCR機能でどこまで文字を抜き出せるのか、検証を行っていきます。
「OCR
テスト」
という横書きのテキストを、OCR機能でテキスト抽出してみると次のようになります。
元の画像では改行していましたが、OCRでテキスト化すると1行にまとまってしまいました。
しかし文字についてはすべてきれいに抜き出せており、精度は100%です。
日本語では縦書きのテキスト画像データもよく見ます。
実際にGoogleドライブで縦書きのテキストを読み取ってみると、次のような結果になりました。
ほぼ正確に読み取れていますが、注意したいのは縦書きから横書きへ変換されてしまう点。
Googleドライブでは縦書き機能が現在搭載されておらず、縦書き文書をOCRでテキスト抽出した場合は自動で横書き表示になってしまいます。したがってGoogleドライブでいったん横書き表示として抜き出した後、無料のツールで縦書き表示にテキストを直したりという手間が発生します。
次は、文字だけではなくビジュアル要素つきの画像からテキストを直接抜き出してみます。
無料素材サービスでダウンロードした、ビジネス単語が散りばめられた画像です。
結果としては、ほぼすべての文字が抽出できました。
色つきで表示されているのが印象的ですね。
これだけでも、GoogleのOCRの精度の高さがわかると思います。
ビジュアル要素付きのテキストも簡単に抜き出せますが、
などに注意して使うとよいでしょう。
次に、手書きのテキストをOCR抽出していきます。
残念ながら日本語の部分は抜き出せませんでしたが、英語の部分は正確にテキスト化できています。
手書きの文字は、ものによるのかもしれませんね。
次は表のテキスト。
Googleドキュメントで作った表を画像にして、OCRで抜き出してみます。
結果としては、残念ながら、1文字も抜き出せませんでした。
結果が表示されるエリアは空白でした。表の線が邪魔をしている可能性もあります。グレー反転しているのが原因かと思い、反転なしでもう一度OCRに掛けましたが、結果は同じでした。
GoogleドライブOCR変換する画像に表が入っている場合は、テキストがきれいに抜き出せているかしっかり確認しておきましょう。
GoogleドライブのOCR機能は、画像やPDFをテキストに変換するだけではありません。
画像やPDFの検索にも対応しているのがポイントです。
たとえば「NATURAL BOTANICAL」と検索をすると、先ほどの「GoogleドライブのOCR性能を検証」の章で使った、手書きのイラスト画像がヒットします。
OCR変換後のテキストだけでなく、元の画像も検索結果に表示されている点に注目。
つまり画像からテキストに変換する作業を行わなくても、Googleドライブに画像をアップロードした時点でOCRの自動認識を使って画像のなかの文字を判別していたということになります。
たとえば、
「以前行ったお店の、看板やメニューをスマホで撮影した写真がなかなか見つからない…」
「資料をスキャンしたが、整理できていない」
といった場合に、Googleドライブへアップロードし、文字で検索すれば見つけることができるのです。
具体的にビジネスにおいて活用できる場面
フォルダに画像やPDFを整理するだけで、ビジネスにおいてさまざまな活用が期待できます。
Googleドライブの真価は、検索機能にこそあるのかもしれません。
ここからは、Googleドライブ以外にもビジネスに活用できるOCRサービスをまとめていきます。
電子ノートとして代表的な「Evernote」には、文章として認識したデータを自動で判別してOCR処理してくれる機能が搭載されています。
テキストだけでなく、画像、音声、スキャン、PDF、文書ファイルをアップロード可能。
ノート、タスク、スケジュールをまとめて管理できるので、便利です。
ただしファイルを編集したいときには、Googleドライブといった他社サービスを利用する必要がある点に注意してください。
「OneNote」はMicrosoft社が提供する電子ノートサービスです。
画像を貼り付け、「画像からテキストをコピー」メニューをクリックすると、画像の下に文字が抜き出されて表示されます。仕組みとしてはGoogleドライブに似ていますね。
「Microsoft Officeなどと連携させながらOCR機能を使いたい」
という場合は、Microsoft社純正のOneNoteのほうが利用に向いているでしょう。
「Adobe Acrobat DC」は、PDF開発元の「Adobe」公式のPDF編集・閲覧用ソフトウェアです。
クリックだけでPDFからテキストを認識できる点が高ポイント。
カスタムフォントを利用したテキストの追加など、高度なPDF編集機能も備わっています。
「PDFを編集する機会が多い」という方にはおすすめできるソフトウェアです。
OCR読み取りに特化したソフトウェアです。
オリジナルの読み取り辞書データベースなどを利用して文字を抜き出す仕組みになっており、
など各種文字を、プレーンテキストとして認識し、取り出せます。
また「PDF書類のレイアウトのまま、Excelへ書類を変換する」といった用途にも使えるのがポイントです。
GoogleドライブといったサービスではOCR機能が限定的ですが、有料であるぶん安定して文字を抜き出して活用できるのがメリット。Googleドライブとの併用もおすすめ。
「本格的に紙書類をデジタル化してペーパーレスを実現したい」
という方にはぴったりです。
無料で使えるWebサービスです。
日本語だけでなく、中国語といった世界46の言語に対応している幅広さもポイント。
といった簡単なステップだけで、すぐ画像やPDFなどからテキストを抜き出せます。
さらにアカウントを作って登録を行うと、
といった機能が解放されるので、より使いやすくなるのがメリットです。
「無料で多彩な機能のあるOCRサービスを使いたい」という方はぜひ使ってみましょう。
10ファイルまで無料でOCR機能を利用可能。
サインアップして利用すれば、もっと多くのファイルをコンバートして使えるようになります。
Googleドライブや「Dropbox」と連携させることで、パソコン上にファイルがなくても、その場でファイルをアップロードして変換できるのがメリットです。また
といった各ファイル形式に幅広く対応しているので、使いやすいのもポイントです。
LINEはメッセージツールとして有名ですが、他にも
といったように多彩な機能を備えています。そして、OCR機能にも対応しています。
LINE上に画像を貼り付け、テキスト化する文章を範囲指定すると、自動でテキストに変換されて表示されます。
また英語の場合は、日本語に翻訳できる機能も備わっています。
「いつも使っているLINEで手軽にOCRを使いたい」という場合は、今すぐ試してみましょう。
スマホアプリとして有名なOCRアプリが「OfficeLens」です。
読み取り精度はアプリの中でもトップクラスで、無料で使える手軽さも人気を集めています。
スマホカメラで撮影した写真から、その場でOCR機能を使ってテキストを抜き出せます。
ホワイトボードの手書き文字なども認識可能で、
などへ変換した後、OneDriveなどに保存できる機能も便利です。
検索の際も画像内の文字が自動認識され、検索結果にヒットするので効率的です。
Microsoftサービスを頻繁に使っている場合は利用したほうがよいでしょう。
Adobeの公式OCRスキャンアプリです。無料ですぐに使えます。
といった多彩な機能を備えており、利便性が高いのが特徴です。
またスキャンしてPDFにしたデータは「Adobe Document Cloud」上で共有して、すぐ編集ができるのもポイントになっています。
Google純正のメモアプリ「Google Keep」にもOCR機能が搭載されています。
Googleドライブと認識レベルは同じかもしれませんが、スマホだとアプリ上から細かいGoogleドライブの機能を呼び出すのは難しいです。Google Keepがあるとその場でメモを取ってOCR化、テキストとして利用するといった使い方もできます。
Googleドライブの補助としてインストールしておいても損はありません。
縦書きについてもOCR認識ができる便利なアプリです。
人工知能搭載が特徴的で、読み取りたい部分を指定する手間はかかりますが、ピンポイントに文字の読み取りが可能です。
フォルダ機能は搭載されていませんが、ファイル名を一覧から変更して分かりやすく整理することは可能になっています。
今回はGoogleドライブの使い方について、OCR機能の使い方、ほかのOCRサービス・アプリもご紹介してきました。
GoogleドライブのOCR機能は、簡単なテキスト抜き出しなどには十分利用できます。
また自動で文字を判別し、画像から検索可能な高度な機能も便利です。
Googleドライブ以外にもたくさんのOCRWebサービス・アプリが存在します。
自分に合ったOCRアプリを実際に試しながら探して、ビジネスをペーパーレスに進めてみてください。
TRASPはさまざまな企業をWebで支援してきました。
お気軽にお問い合わせください。
お問い合わせはこちら