情報源はMicrosoft 365 メッセージセンター「MC477853 非構造化および事前構築済みドキュメント処理(従量課金制機能)のプレビュー版が公開されます」となります。
説明をする前に、何点か用語の説明をする必要があります。 まずは、構造化データ・非構造化データ・半構造化データについて、説明をします。
データ名 | 内容 | 例 |
---|---|---|
構造化データ | 表のように「列」と「行」の概念をもつデータのことです。データベース化できるデータとも言えます。 | Excel表、リレーショナルデータベース |
半構造化データ | データに規則性はあるものの、データを見ただけでは二次元の表形式に変換できないデータのことです。 | XML、json |
非構造化データ | 「列」と「行」の概念をもたない、データベース化できないデータです。 | 画像、動画、音声、手紙の文章 |
非構造化ドキュメント処理ならびに事前構築済みドキュメント処理についても、説明をします。
処理名 | 内容 |
---|---|
非構造化ドキュメント処理 | AIが非構造化データのドキュメントを自動的に分類し、そこから情報を抽出する機能のことです。 手紙や契約書などの非構造化ドキュメントでの利用に向いています。 |
事前構築済みドキュメント処理 | AIが構造化データや半構造化データのドキュメントを自動的に分析し、そこから情報を抽出する機能のことです。 データの構造が決まった請求書やレシートのようなドキュメントでの利用に向いています。 |
※ 現状、事前構築済みモデルとして登録されているのは「請求書モデル」と「レシートモデル」の2種類のみです |
今回の更新では、非構造化ドキュメント処理モデルならびに事前構築済みドキュメント処理モデルを SharePoint ライブラリで利用できるようになります。
具体的なユースケース
SharePoint ライブラリに請求書をアップロードした際の画面ショットがMicrosoft Syntexのページに公開されております。
Microsoft Syntexの概要 | Microsoft Learn
例えば「請求書モデル」を利用して、請求書の内容を読み取り、ドキュメントプロパティやSharePoint Listに連携することが可能となるようです。
本更新のメリット
非構造化ドキュメント処理モデルや事前構築済みドキュメント処理モデルの機能を、ドキュメントライブラリで実装することができる事です。
AI Builderは強力ではありますが、そこで定義したモデルを利用するためにアプリケーションを作るなど、実際にユーザーに使ってもらうまではいくつかステップが必要でした。
それをSharePoint Onlineに実装することで、利用者が特にAIを意識せずにAIの利便性を享受できることになります。
「AI Builderは強力そうだし、処理したいデータもある。けど、どうやってエンドユーザーに広めていくか…」と悩んでいる方は、利用を検討してみてはいかがでしょうか。
宣伝:Microsoft 365 のアップデート情報をチェックし、重要情報をお伝えするJBSサービスのご紹介
JBSサービス"アップデートキュレーション for Microsoft 365"では、日々Microsoft 365 Message Centerの内容をチェックし、機械翻訳ではなく人間が読みやすい形での要約情報をお届けしています。ただ情報をお伝えするだけではなく、日本のシステム管理者が意識するであろうセキュリティ・ガバナンス面からのアドバイス、重要情報はPowerPoint形式でより分かりやすくお伝えするなどの工夫を行っております。
ただいま、30日間無料キャンペーン(※)を行っておりますので、是非お気軽にお試しください。
寺田 敬佑(日本ビジネスシステムズ株式会社)
クラウドマネージドサービス本部 所属。Microsoft 365 導入エンジニアとしてキャリアを重ねたのち、現在は JBS の Microsoft 365 系サービス/プロダクトマネージャーとしてサービス開発指揮を執る。
担当記事一覧