ドキュメント自動入力AIプラットフォーム ディープシグマDPAについて
-
Upload
hirono-jumpei -
Category
Business
-
view
503 -
download
0
Transcript of ドキュメント自動入力AIプラットフォーム ディープシグマDPAについて
ドキュメント自動入力AIプラットフォームディープシグマDPAについて2017/12/1 デジタルフォースシェルパ AI&Analytics 新井 克人
Copyright SIGMAXYZ Inc. all rights reserved. 0
Strictly Confidential/Copyright SIGMAXYZ Inc. all rights reserved. 1
Deep Learningを活用することで従来より遥かに精度の高い、OCR技術をコアとしたドキュメント運用自動化ソリューション(≒超高級高性能OCR)
ディープシグマDPAとは ~概要
Copyright SIGMAXYZ Inc. all rights reserved. 2
OCRパッケージ・AI-API・DNNのコンペによる技術検証を実施し、ビジネス・業務・システム要件を満たすことができるソリューションを選択
なぜディープシグマDPAを始めたのか - OCR関連技術検証
ビジネス要件
業務要件
ビジネス要件の明確化業務要件(最終出力、目座す精度、レスポンス)を検証要件へ反映
プロセス
ポイント
初期調査 技術検証実施
②
③
検証要件の明確化①画像補正(入力画像)要件②レイアウト認識要件③文字認識要件④最終出力(項目補正)要件⑤既存システム連携要件
検証要件の整理
①
④
⑤OCRパッケージ
AI-API
DL構築
既存システム
①, ②, ③, ④
③
①, ②, ③
④, ⑤
①, ②, ③
各社(OCR、AI-API、DL)最小限の技術検証要件に絞り、短期での技術検証を実施
Copyright SIGMAXYZ Inc. all rights reserved. 3
従来のOCRではフォーマットの座標を特定・設定し、各項目の場所を切り取った上で文字を認識しており、項目が同じでも座標が異なる場合は別の帳票として扱う
なぜディープシグマDPAを始めたのか - 従来のOCRの方式
★基準座標
● ●
●●
①基準座標からの距離や座標を基準に
読取箇所を認識
②行・文字の切り出し
③文字認識
④辞書補正
DeepLearningの導入が遅れているエリア
Copyright SIGMAXYZ Inc. all rights reserved. 4
ベンダー/ユーザー視点の矛盾を解決する新たな顧客協創型のソリューションが必要
なぜディープシグマDPAを始めたのか - 既存OCRパッケージのジレンマ
データ
オープン
1社でも収集可能
クローズ
複数社の協力が必要
ベンダー視点
ユーザー視点
機能文字認識機能(活字・手書)
1社で教師データの収集が可能⇒コンペが激化最終的には技術力があり、かつ教師データ入手サイクルを築いたベンダーが勝利する領域
レイアウト認識、辞書補正機能
ベンダー側ではデータ収集が困難なためユーザー企業の協力(データ提供)が必須コンペが激しくてデータが分散
Deep Learningが良く分かっていない≒自身のデータの価値に気づいていないノンコア領域のため、自身でツールを作るのは大変
類似ソリューションが多すぎる同業他社内で殆ど同じツール選定作業が繰り返される
顧客協創型のソリューションが
必要
Copyright SIGMAXYZ Inc. all rights reserved. 5
業界1stユーザーと共同開発したテンプレートを2nd, 3rdユーザーに従量課金サービスを提供することで業界全体での効率化を目指したサービス
ディープシグマDPAの狙い ー サービススキーム概要
顧客 ディープシグマDPA ビジネスパートナー
1stユーザー
Deep Sigma DPA
システム費
システム提供
パートナー
文字認識
RPA BPO
初期費用
システム提供
ロイヤリティ パートナー
アルゴリズム提供
レイアウト認識
文字認識
辞書補正
自動入力
2ndユーザー
利用料金
サービス提供
3rdユーザー
利用料金
サービス提供
ディープシグマDPA 伝票情報処理自動化サービス
Copyright SIGMAXYZ Inc. all rights reserved. 6
Deep Sigma DPAは学習用のデータが数百枚単位で必要なため、フォーマット数が多く、月間百枚以下の読み取りが必要な業務には別ソリューションを提供
用途に合わせたOCRソリューション
処理枚数 月間1万枚以上 月間数百枚~数千枚
目標精度 手入力を最小限にする 手入力での確認・修正を前提とする
対象帳票 証明書・申込書・レシート 等 請求書・注文書 等
フォーマット 数種に限定 多種類を処理
Copyright SIGMAXYZ Inc. all rights reserved. 7
マイクロソフト社のComputer Visionを活用し、帳票種類・項目・金額を自動認識するソリューション
伝票情報処理自動化サービス
Microsoft Azure
Azure Cognitive ServicesComputer Vision