背景
ELYZAが「ELYZA Brain」を開発した背景
2012年にAI研究において深層学習を用いた手法が登場しブレイクスルーが起き、画像認識では2015年に「人間を超える」精度を実現しました。それ以降、AIによる人間社会のシフトが現実のものとなることへの機運が産業界においても高まり、現在は様々な分野において社会実装が大きく推進されています。
一方、自然言語処理分野では、主に以下の技術的課題により「人間を超える」精度が実現されておらず、画像分野と比較して社会実装出来る分野が限られていました。
自然言語処理分野における
課題
1. 質・量ともに、十分な教師データの準備が難しい。
2. 文脈や一般常識等を踏まえられず精度が低い。
そのような中、2018年秋にGoogleより汎用言語モデル「BERT」が発表され、2019年には自然言語処理分野で「人間を超える」精度が実現するブレイクスルーが起きました。「BERT」以降の汎用言語モデルは、これまでの課題を解決し得る以下のような特徴を持っています。
BERT以降の
汎用言語モデルの特徴
1. 大量のテキストで事前に学習しているため、教師データの準備は少なくて済む。
2. 多くの自然言語処理タスクに汎用的に適用でき、精度が高い。
ELYZAはこのような背景を基に、BERT以降の汎用言語モデルを活用した日本語AIエンジン「ELYZA Brain」を開発しました。「ELYZA Brain」はELYZAが収集した大量の日本語文章データで数十億のパラメータのモデルを学習済みであり、すでに「人間を超える」精度*を達成しています。
*ELYZA社内の調査結果
自然言語エンジンで
実現できること
「ELYZA Brain」は自然言語処理分野における
様々なタスクに活用可能です。
以下に「ELYZA Brain」で実現し得る事例の一例を示します。
-
文章の作成支援
文章を高精度で理解したうえで修正や評価を行い、
「良い文章作成」を支援します。広告文の修正、評価
求人文の修正、評価
メール文章の修正、評価
契約書の修正 など -
高精度な対話システム
様々な場面で利用可能な高精度対話システム
(チャットボット)を構築できます。カスタマー質問応答
外食業における注文受付
サイネージにおける利用者案内 など -
大量の文章から必要な情報を
自動で抽出・整理大量の文章データを基に関心箇所を自動抽出できます。
抽出した情報を基に文書を整理し管理することが可能です。契約書から当事者や期限などを自動抽出し契約書を整理
カルテから情報を抽出し整理
webページから情報を抽出し表に整理 など
プログラム
ELYZAは「ELYZA Brain」を活用した
『パートナープログラムNLP30』を実施しています。
パートナー
OpenAIのGPT-3を筆頭に、自然言語処理分野では大きな変化が起こっています。ELYZA Brainは、こうした新しい技術を使い、また日本語で最大規模のデータを用いて学習しており、今後、様々なユースケースで革新的な変化をもたらすことが予想されます。国内の多くの産業で生産性の向上につながることを期待しています。
松尾 豊(東京大学教授・株式会社ELYZA 技術顧問)
あらゆる面で一段上のクオリティを有する法務サービスを提供すべく、自然言語処理AI活用の研究に取り組んでいます。
「ELYZA Brain」についても大きく期待しています。
飯田 耕一郎(森・濱田松本法律事務所 パートナー)
連絡先
共同研究開発のご相談、業務に関するお問い合わせは、コンタクトフォームよりお願いいたします。
極力迅速にご返信差し上げる予定ではございますが、会社として大変多くの問い合わせをいただいており、時間を要する場合や返信できない場合がございますこと、ご了承いただけますと幸甚です。