本週精彩圖表
(資料來源: RAG From Scratch: Part 1 (Overview))
編輯的話
在我們深入本期精彩內容之前,我想要特別感謝 ChatGPT x AI 融入教學 | Facebook 的版主施亦盈,她為我們提供了這次精彩圖表的信息。ChatGPT x AI 融入教學是一個致力於推廣ChatGPT在教育領域應用的社群,非常歡迎大家的加入。
現在,讓我們回到這期要與大家分享的內容。作為小編,我特別被這週的精彩圖表及其來源課程所吸引。從 AI 工程師的角度來看,我認為入門級的提示技巧至關重要,進階層面則是像 AI Agent 這樣的概念,但最引人注目的無疑是 RAG 技術。誠如RAG的發明者開玩笑地說: 「如果早知道這項技術未來的重要性,我肯定會為它取一個更加響亮的名字😆」。
正是這篇課程中的圖表激發了我深入研究並分享更多 RAG 相關資源的決心。希望在不久的將來,我們能夠一起探討這些技術的細節,共勉之。
本期內容
OpenAI 官方提示工程指南 - 註釋
策略四、給模型一些“思考“的時間
提示技巧 4-1:指示模型在急於得出結論之前先提出自己的解決方案
大型語言模型應用介紹
利用 AI 來創建著色簿
「從教材生成,學習GPTs開發」課程介紹
精彩文章(論文)分享
LangChain 超棒 RAG 開發課程介紹
OpenAI 官方提示工程指南 - 註釋
(此段落為 OpenAI 官方提示工程指南的註釋,原文請參考: Prompt engineering - OpenAI API)
策略四
給模型一些“思考“的時間
如果被問到17乘以28是多少,你可能不會立刻知道答案,但是你仍然可以花時間算出來。同樣地,模型在嘗試立即回答問題時,比起花時間算出答案時更容易犯推理錯誤。在回答之前要求一個“思考的過程”可以幫助模型更可靠地推理出正確的答案。
提示技巧 4-1:指示模型在急於得出結論之前先提出自己的解決方案
有時候,當我們明確指示模型在得出結論之前先從基本原理進行推理時,我們會得到更好的結果。例如,假設我們想要模型評估一個學生對於數學問題的解答。最直接的方法是簡單地問模型學生的解答是否正確,如以下範例:System:判斷學生的解答是否正確。 User:問題陳述:我正在建造一個太陽能發電設施,我需要幫助計算財務問題。 土地成本每平方英尺100美元 我可以以每平方英尺250美元的價格購買太陽能板 我談判了一份維護合同,每年固定成本10萬美元,另加每平方英尺10美元 第一年運營的總成本是多少,作為平方英尺數量的函數。 學生的解答:設x為裝置的大小,單位為平方英尺。 土地成本:100x 太陽能板成本:250x 維護成本:100,000 + 100x 總成本:100x + 250x + 100,000 + 100x = 450x + 100,000 Assistant:學生的解答是正確的。
由以上的提示結果可以看到,助理判斷學生的回答是正確的,但是其實不是。我們可以要求語言模型先提出自己的方案來修正這個問題,如以下範例:
System:首先解決你自己的問題解答。然後將你的解答與學生的解答進行比較,評估學生的解答是否正確。在你自己解決問題之前,不要判斷學生的解答是否正確。 User: 問題陳述:我正在建造一個太陽能發電設施,我需要幫助計算財務問題。 土地成本每平方英尺100美元 我可以以每平方英尺250美元的價格購買太陽能板 我談判了一份維護合同,每年固定成本10萬美元,另加每平方英尺10美元 學生的解答:設x為裝置的大小,單位為平方英尺。 土地成本:100x 太陽能板成本:250x 維護成本:100,000 + 100x 總成本:100x + 250x + 100,000 + 100x = 450x + 100,000 Assistant:設x為裝置的大小,單位為平方英尺。 土地成本:100x 太陽能板成本:250x 維護成本:100,000 + 10x 總成本:100x + 250x + 100,000 + 10x = 360x + 100,000 學生的解答是不正確的。他們在維護成本計算中犯了錯誤,使用了100x而不是10x。第一年運營的正確總成本是360x + 100,000。
以上的概念,我們舉一個生活上的例子來說明:
假設一位生物學教師要求學生解釋DNA複製的過程。在這個情境下,我們利用語言模型來評估學生回答的準確度。然而,我們不會直接詢問模型學生的答案是否正確。相反,我們首先指導模型根據生物學的基礎原理,詳細地闡述DNA複製的過程。接著,根據這一過程評估學生的答案。這樣做不僅確保了模型在評估學生回答之前具備從基礎到高階的理解,而且還提升了模型判斷答案正確性的能力。
大型語言模型應用介紹
在這一期中,我們發現了一個相當有趣的大型語言模型應用:利用 AI 來創建著色簿。另一個促使我決定與大家分享的原因是,這項技術不僅適用於Microsoft Image Creator,同時也適合於Midjourney使用。對此感興趣的朋友,不妨嘗試看看。
接下來,讓我們來看看如何使用Microsoft Image Creator:
1. 直接到 Microsoft Image Creator 頁面
2. 輸入下方的提示詞:
On the left, a black and white simple children's coloring book illustration featuring a [insert description of image] with no shading, with a white background. On the right, the same illustration with color. --ar 2:1 --style raw --sref [see image below] --stylize 250 --v 6
3. 等待一陣子後,你就會得到幾張圖片讓你選擇~
資料來源:X (twitter.com)
「從教材生成,學習GPTs開發」課程介紹
在本期電子報中,我們和大家分享了一個 LangChain 官方很棒的RAG 課程,該課程深入探討了RAG(Retrieval-Augmented Generation)技術的複雜性和專業性,揭示了其在當今 AI 發展中的關鍵地位。正如您所讀的那樣,掌握這些尖端技術不僅需要理論知識,更需要實際操作的經驗和深刻的理解。
正因為此,我們特別推出了一門線上課程:【從教材的生成,學習GPTs開發】。本課程目標在為 AI 工程師、MIS 部門主管、產品經理等專業人士提供從基礎到高階的全面 GPTs 技術學習路徑。透過我們引導式的教學方法,包括預習材料、實際程式碼示範、專屬線上課程群組,以及結業專案的實作,您將能夠系統性地掌握大型語言模型的開發技能,並立即將這些知識應用到實際案例中。
特別是,我們課程中提供的實用 Colab 程式碼和結業專案的部署使用 Vercel 及 AstraDb 雲端服務,其用意在讓您無需煩心於技術部署,專注於學習核心概念和技能的提升。此外,結業生將獲贈完整的 GPTs 示範專案程式碼,幫助您節省從零開始設定專案的時間,並在未來的職業道路上走得更遠。
如果您渴望在 AI 領域取得突破,願意深入學習並實踐這些先進技術,我們誠邀您查看我們的招生簡章,了解更多課程細節和報名信息。加入我們,一起在AI的浪潮中乘風破浪。
精彩文章(論文)分享
LangChain 超棒 RAG 開發課程介紹
內容導讀:
這段 RAG 課程的 transcript 提供了對 RAG(Retrieval-Augmented Generation)技術的基礎介紹,特別是在構建 RAG 管道時的應用。課程透過一個實際的程式碼演示,展示了如何快速開始使用 RAG,並解釋了整個過程的各個步驟。 課程內容簡介: 課程從安裝必要的包和設置環境變量開始,這對於追蹤和可視化在建立 RAG 管道時非常有用。接著,通過一個快速啟動的例子,演示了如何加載、拆分、嵌入、索引文檔,以及如何設置和使用檢索器和語言模型(L-M)來生成回答。最後,課程展示了如何查看和分析生成的回答,提供了 RAG 工作流程的一個概覽。 課程重點: 安裝和環境設置:課程開始於如何安裝所需的包並設置環境變量,強調了設置 LanksMith 鑰匙的重要性。 程式碼演示:透過一個 notebook 的程式碼演示,詳細解釋了從文檔加載到生成回答的完整過程。 文檔處理:介紹了如何加載、拆分文檔,以及為什麼拆分對於 RAG 流程來說很重要。 向量存儲和檢索器:課程中使用了 Chrome 作為本地運行的向量存儲,並解釋了如何使用檢索器來尋找相關文檔。 定義提示和處理回答:展示了如何定義 RAG 的提示,進行文檔處理,設置輸入鏈,並格式化輸出為一個字符串。 結果分析:課程結尾展示了如何使用 Langsmith 查看和分析問題和生成的回答,以及如何查看檢索到的文檔和最終傳遞給 L-M 的提示。 這個課程提供了一個對 RAG 技術基礎和應用的全面介紹,並預告了將來會有更多詳細介紹各個組件的短視頻。