はじめに
OpenAIについて
昨今ニュースになっているOpenAIですが、2023年1月16日にAzureでOpenAIが一般提供が開始されました。
news.microsoft.com
OpenAIは今巷で盛り上がりを見せているChatGPTを開発している組織となります。GPTや自然言語のモデルの説明は今回のブログでは省略しますが、高性能の自然言語のAIがMicrosoft社のAzureでも使えるようになったということになります。
Why Azure
OpenAIでも使えますがAzureで使うメリットとしてはAzureのサービスに組み込まれているため大きく以下の点が保護されています。
- トレーニングデータの保護
- VNETやRBACでセキュリティの保護
エンタープライズのお客様の情報をFine Tuningで利用する際にはAzureのサービスを利用する必要が出てくると考えます。
Azureでの使い方
申請から承認まで
一般提供されましたが、2023年2月16日現在Azure OpenAIは申請制で以下のURLからリクエストを上げる必要があります。アナウンスでは10営業日で承認とのことでしたが、1月中旬に申請しましたが承認まで約3週間ほどかかりました。
リソースのデプロイ
AzureのPortal画面からリソースをデプロイします。
承認が終わっていないサブスクリプションは以下のようなメッセージでリソースの作成ができません。
承認が終わっているサブスクリプションは以下のように作成画面が表示されます。
現在サービスされているリージョンは3か所ですが、リージョンによって使えるモデルが異なるので注意が必要です。
「確認と作成」を押していくとデプロイできます。(2~3分)
モデルをデプロイする
デプロイできたリソースの探索を押してStudioに入ります。
Studioに入りまずはモデルのデプロイをします。
ベースモデルとデプロイ名を入力して作成します。
(今回はText-davinci-002とText-davinci-003を試しました)
文章の要約を使ってみる
GPT-3プレイグラウンドを押します。
文章要約を試してみました。
元の文章は弊社のプレスリリースの文章を使用しています。
プレイグラウンドの下に推奨のモデルがText-davinci-002と表示されています。
ということでまずはText-davinci-002で試しました。要約はしてくれたものの英語になってしまいました。
「要約」と「日本語に翻訳」を分けると日本語で要約してくれました。
次にText-davinci-003で試してみました。こちらは一発で日本語で要約してくれました。
Text-davinci-002が推奨でしたが、日本語に関してはText-davinci-003の要約のほうが良いように感じました。今後他の使い方も試す予定です。
利用料金
以下のサイトを参考にOpenAIとAzureでの料金を比較してみました。(2023年2月16日現在)
https://openai.com/api/pricing/
https://azure.microsoft.com/en-us/pricing/details/cognitive-services/openai-service/
OpenAI | Azure | ||
Base models 1k token |
Ada | 0.0004 | 0.0004 |
Babbage | 0.0005 | 0.0005 | |
Curie | 0.002 | 0.002 | |
Davinci | 0.02 | 0.02 | |
Fine-tuned models 1k token |
Ada | 0.0016 | 0.0004 |
Babbage | 0.0024 | 0.0005 | |
Curie | 0.012 | 0.002 | |
Davinci | 0.12 | 0.02 | |
Fine-tuned models Deploy 1hour |
Ada | - | 0.05 |
Babbage | - | 0.08 | |
Curie | - | 0.24 | |
Davinci | - | 34 | |
Embeddings 1k token |
Ada | 0.0004 | 0.004 |
Babbage | - | 0.005 | |
Curie | - | 0.02 | |
Davinci | - | 0.2 | |
Fine-tuned models OpenAI 1k token Azureは1時間当たり (課金は15分ごと) |
Ada | 0.0004 | 20 |
Babbage | 0.0006 | 22 | |
Curie | 0.003 | 24 | |
Davinci | 0.03 | 84 |
2023年2月16日現在Fine-tuned modelsは使えないそうですが、Base modelsを利用する分には変わらないですがFine-tuned modelsを利用する際に価格差が出てくると考えます。
最後に
今回は要約のみでしたが、ほかにも分類やコンテンツ生成、セマンティック検索、コード生成などいろいろな機能がありますので順次試していきたいと考えています。
またプロンプト(質問文)の書き方で結果が変わるのでPrompt Engnieerringという言葉もあるようですがこのあたりもいろいろ試していきたいと考えています。
上田 英治(日本ビジネスシステムズ株式会社)
エンジニアとしてインフラ構築、システム開発やIoT基盤構築等を経験し、現在はクラウドアーキテクトとして先端技術の活用提案や新規サービスの立ち上げを担当。
担当記事一覧