【Azure OpenAI】搭配視覺使用 GPT-4 Turbo

今日 Azure OpenAI 釋出了 12 月份的改版，其中最期待的功能當然是 GPT-4 Turbo with Vision 了，雖然隔壁棚已經上線快一個月了，但收到消息的當下還是馬上到 Portal 上建了一個來玩。

模型佈署

GPT-4 Turbo with Vision 目前被歸屬在 GPT-4 中獨立的一個模型版本：gpt-4-vision-preview，與上個月的 1106 版相同，要使用的話都需要額外佈署模型，不過優點就是配額與一般的 gpt-4 模型是分開計算的，不用擔心佔用到現有的額度。

另一個需要注意的地方是，gpt-4-vision-preview 首批開放只限於瑞士北部、瑞典中部、美國西部與澳洲東部四個地區而已，不意外地再次增加了模型的管理難度😔。

vision-preview 預設可使用 10K 的配額

GPT-4 Turbo with Vision 可以直接在遊樂場中快速試用，進入遊樂場的聊天頁面後，選到剛剛佈署的 gpt-4-vision-preview 模型，下方就會出現可以上傳檔案的圖示了。

選對模型才能上傳檔案

以下測試了兩個 OpenAI 官方提供的範例並改成了繁體中文的版本，另外還有一個我在工作中常遇到的架構圖案例。

Prompt：Answer question I.1.a with Traditional Chinese. Think step-by-step.

GPT-4：

雖然不確定回答的正不正確，畢竟我也不會這題，但確實根據輸入的圖片回答了問題。

Prompt：Can you explain why this is funny use Traditional Chinese. Think about it step-by-step.

GPT-4：

Prompt：Explain the advantages of this architecture in Traditional Chinese.

GPT-4：

同時輸入文字與圖片讓 GPT 又進入了另一個境界，尤其是第一個範例中的物理問題，從一開始在發佈功能的文檔中看到，到了現在實際上線後測試，真的是帶來驚奇。

另外 Azure 上也同時釋出了整合 Azure AI Vision 的功能，突破了原本 gpt-4-vision-preview 無法輸入影片的限制，我猜這大概也是慢了一個月上線的原因，後續也會再有這部分的測試，請期待下篇！