LINEのAI技術で『手書きフォント』を自動生成
2020年11月26日(木)に、コミュニケーションアプリ『LINE』内で表示されるテキストを、お好きなフォントへ設定できる「カスタムフォント」機能をリリースしました!
本日、12月8日(火)には、LINE CLOVAのAI-OCR技術と画像生成技術を活用し、AIで生成した「手書きフォント」も追加されています。
様々な種類のフォントの中から、お好きなフォントを選択して設定すると、LINEアプリ内のテキストをカスタマイズすることができます。
実はこのAI技術で生成した手書きフォントは、商用化で使用できるレベルの精度の高い手書きフォントで、数種類だけではなく、数多くの様々な特徴の手書きフォントを生成することができます。さらに、LINE CLOVAのOCRの認識精度向上にも役立てています。
今回は、手書きフォントを生成したAI技術と、世界最高水準の認識精度を誇るCLOVA OCRがどのように認識精度を上げているのかをご紹介していきます。
たった250文字の手書き文字から1万文字以上の『手書きフォント』を自動生成!
この手書きフォントの生成には、「GAN(Generative Adversarial Network)」という生成モデルのAI技術を活用しています。たった250文字程度の手書き文字から、1万文字以上の手書き文字を「GAN」によって自動生成することができます。
【これまで生成した手書き文字の一例】
「GAN」はデータから特徴を学習させることで、実在しないデータを生成したり、存在するデータの特徴に沿って変換できる技術です。「GAN」には様々なモデルがあり、画像生成が有名ですが、例えば、人物画像から実在しない架空の人物画像を作り出したり、顔写真から絵画風の肖像画のような画像を生成することができます。
LINE CLOVAでは「GAN」の中でも、pix2pixという、画像を異なるスタイルの画像に変換することができる技術を利用しています。この技術により、異なる特徴を持つ、精度の高い手書き文字を数多く生成することに成功しました。
AI技術は学習させればさせるほど、その精度は高まります。社内や社外の多くの方に協力いただき、何千という1人1人の手書き文字をAIに学習させ、商用化できるレベルまで開発を進めてきました。
『手書きフォント』だからこそ、伝わる思い
今回冒頭でご紹介した「カスタムフォント」機能のように、『手書きフォント』を活用した場面やサービスは数多く存在します。映画や商品の広告やサイト、ロゴなどで使用されているのを見かけたことがある方も多いのではないでしょうか。
手書き文字ならではの温かみや雰囲気は、人それぞれ異なり、人の気持ちがより伝わりやすくなるものです。手書き文字を使用することで、企業や人が伝えたいメッセージの訴求力を強めることもできます。
一般的には、広告やサイト、ロゴなどの短文でのみ利用できるサービスが多いですが、LINE CLOVAの「手書きフォント」は、短文だけではなく、動画のテロップやブログなどの長文で使用することも可能で、種類も数多く保有しています。
また、これまで手書き文字を様々な種類で数多く生成するためは、莫大な時間とリソース、コストが必要でした。そういった課題もこの技術によって解決しています。
これまで1人分の手書きフォントを作るだけでもとても骨の折れる作業工程と時間が必要でしたが、特徴やクセがある手書き文字を、何人・何百人分も短時間で生成することができるので、例えば著名人の手書きフォントをスタンプや映画の宣伝などのプロモーションで活用することも可能です。
その他にも、以下のようなケースで活用が期待できます。
☑️ ユーザーのフォントを作成できるサービス
(例:家族の手書きフォントを作成し、アルバムや手紙に利用したり、子供の頃の文字を残すなど)
☑️ WEBフォントとして商用利用
☑️ ブログや小説など長文を書くクリエーター向けのサービス
☑️ 手書きフォントのクリエーター向けのフォント作成の補助サービス
手書きフォントを利用したサービスを展開されている企業様で、ご興味がありましたら、ぜひLINE CLOVAへお声かけください。
データを増やす・質を上げる技術「GAN」の活用で、OCRの認識率を飛躍的に向上
一方で、そもそも、私たちはなぜこの技術を利用し、手書きフォントを生成しようと思ったのか?それは、OCRの認識精度の向上と大きく関係しています。
LINE CLOVAのOCR技術は、文書解析と認識に関する国際会議(ICDAR:2019/3/29時点)では4分野にて世界No.1を獲得し、高い認識精度と評価されました。
LINEが提供する「CLOVA OCR」を活用することで、領収書の文字起こしなど、煩雑な手入力作業を簡単に自動化することができます。
▶︎「CLOVA OCR」の詳しい説明はこちら
前述のpix2pixによって、人が書いたような手書き文字を量産し、OCRに学習させることで手書き文字の認識精度を飛躍的に向上させています。
AI技術には様々な種類があり、多くの企業で活用され開発が進んでいますが、AI技術の認識精度を高めるためには、AIに学習させる莫大なデータ(教師データ)が必要です。(一般的に活用されている機械学習モデルの場合)
その上、用意したデータにタグをつける作業(アノテーション)が必要なため、莫大な教師データとアノテーションの作業時間を確保することができないと、高度にAI技術を利用することは難しく、AI技術があるだけではビジネス利用や実用的な活用ができません。
わざわざ手で書いてもらった文字データを用意することなく、無数の手書き文字データを用意できるため、少しの時間で効率よくAIに学習させ、劇的なスピードで認識率を向上させることができるのです。また、文字の特徴も数多く学習できるので、その分、様々な特徴の手書き文字を認識することを可能にしています。
実は日本語の認識が難しいOCR
OCRという技術自体は古くからありますが、英語の認識率は比較的高いものの、日本語の認識率をあげるのは、実はとても難しいことです。
英語はアルファベットの26文字で特徴もシンプルです。それに対し、日本語は3,000以上の文字があり、漢字・平仮名・カタカナを組み合わせて文章を作るため、OCRでそれらの文字の特徴を捉え、文章として意味のあるものと認識することが難しくなります。
LINE CLOVAはアジア圏や日本に向けて、ビジネスや実用的に利用できるAI技術を提供し、CLOVA OCRは手書き文字の認識率向上だけではなく、文章を意味のあるものと認識させるなどの多くの開発を進めてきました。
その結果、手書き文字だけでなく、斜めになった文字、歪んだ文字、湾曲した文字など、悪条件下でも精度高く認識し、多言語の対応も可能です。
CLOVA OCRを活用することで、伝票登録・領収書・身分証明証などの、モバイルアプリ上における情報入力など、煩雑な入力作業をなくし、手入力時間を大幅に削減します。
また、一般的なOCRサービスの料金設定は、読み取りを指定した項目1枠ごとでの換算が多いのに対し、CLOVA OCRは1枚ごとに換算をするため、ランニングコストが想定しやすく、項目数が多い大量の書類の読み取りを自動化する場合でも、低価格でOCRの導入が可能になります。
CLOVA OCRに関してご興味のある方は、ぜひお問い合わせください!
LINEのAI技術
先日行われた「LINE DEVELOPER DAY 2020」でも、LINE CLOVAのAI技術が紹介されましたが、数多くのAI技術を保有し、開発を進めています。
文字認識、画像認識、動画解析、音声合成、音声認識といった世界最高水準*1のAI技術やサービスを通して、生活やビジネスに潜む煩わしさを解消すること、社会機能や生活の質を向上させることで、より便利で豊かな世界をもたらしたいと考えています。それぞれ社会や企業の課題、ニーズに合わせて設計から実装までを行い、AIの社会浸透を推進しています。
AI技術が、人に寄り添い、人をサポートし、人の負担を減らす。「ひとにやさしいAI」が、自然なカタチで生活やビジネスの一部となるような、「これからのあたりまえ」の創出をビジョンとし、様々なニーズや課題に寄り添って、サービスを届けていきます。