距離上篇在 Early Access Playground 試用 o1 模型後又過了兩週,今天終於等到 API 開放使用啦!本篇將紀錄如何使用 Python SDK 存取 o1 模型。 系列文章 【Azure OpenAI】快速試用 o1 模型 模型佈署 在先前開放的 Early Access Playground 中使用 o1 是不需要另外佈署模型的,不過回到使用 API 來存取 o1 模型,就需要像之前的模型一樣先進行佈署才能使用,相信大家都很熟悉了。 使用 Python SDK 一樣使用熟悉的 openai 套件: 2024-09-01-preview 初始化的方式與先前模型都一樣,需要注意的是 o1 模型目前只能使用最新的 API 版本 2024-09-01-preview 來訪問。 Chat Completions 將 model 填入 o1-preview ,或是你的模型佈署名稱, messages 也一樣是歷史對話堆疊的 List。 回應如下: 查看 Token 使用量 內建 Chain of Thought 的 o1 比起過往的模型會消耗較多的 Token,因此我們特別把 Token 使用量拉出來看。 回應如下: 其中 prompt_tokens 、 completion_tokens 、 total_tokens 在先前的 API 就已經存在了,分別代表Token 的 Input、Output 與總使用量,而在新的 completion_tokens_details 中可以看到 reasoning_tokens 使用了 320 個 Tokens,居然佔了總輸出 Token 的 80% 以上! 控制 Token 成本 已往我們可以使用 max_tokens 參數來控制 Token 的用量,但在 o1 模型中棄用了 max_tokens ,取而代之的是使用 max_completion_tokens 參數,來看看這段程式碼: 回應如下: 沒東西?那再看一次 Token 量。 回應如下: Token 居然是有被使用的! 這表示 max_completion_tokens 並不像過往使用 max_tokens 這麼簡單,先前在回應遇到...
對於一般使用的 Azure VM,或多或少都需要在防火牆或 NSG 上允許部分的存取規則,來讓我們進入 VM 完成工作,而這樣的允許規則就讓 VM 變得容易受到攻擊。
Azure VM 上的 Just-In-Time (JIT) 存取是 Microsoft Defender for Cloud 的其中一項功能,JIT 可以讓我們在需要連線 VM 時,在 NSG 上暫時性地新增一條允許存取規則,並且可以在設定的一段時間後自動失效該存取規則。
必要條件
也因為 JIT 是 Defender for Cloud 的其中一項功能,所以必須在訂閱層級先開啟 Defender for Servers Plan 2 才能使用 JIT,如果先前未開啟 Plan 2,在開啟前記得先評估可能產生的額外費用。
建立 Azure VM
首先我們先在符合條件的訂閱上建立一台測試用的 VM,都使用最基本的 Windows 就好。
網路部分我們建立一個新的 VNet 與一個稍後要用來連線的對外 IP,另外也記得讓系統順便幫我們建一個基本的 NSG 出來。
啟用 JIT
啟用方式非常簡單,在 VM 的 Portal 中進入左側「連線」→「連線」頁籤,再點擊「Just-In-Time 原則」→「針對此連接埠設定」→「設定」就完成啟用了。
要求 JIT 存取權
設定好 JIT 後,使用者在連線前要先請求存取權,可以根據需求請求單一 IP 或不限 IP 的存取權,這步也是在同一個頁面中點兩下就搞定了。
請求成功後一樣可以到 NSG 的畫面,這時 JIT 會自動加上一條優先度 100 的 3389 允許規則,以此來允許我們的 RDP 連線。
其他連線方式
預設情況下,請求將允許有 3 小時的連線時間,對於其他連接埠或有調整連線時間的需求也可以自行新增設定。
連線測試
結論
JIT 不但能有效減少 VM 對外暴露的入口,定時讓允許規則失效的機制也減少了管理工作,與以往常發生機器用完忘了關閉連線的風險,在設定與使用上都很簡單方便,唯一的缺點大概就是 Defender for Servers Plan 2 的成本,這點就需要大家自行評估囉!
留言
張貼留言