在春節(jié)假期期間,Deep Seek引發(fā)了社會各界的廣泛關(guān)注。幾位朋友紛紛向我詢問對Deep Seek的看法,這促使我深入思考并分享我對利用GPT(Generative Pre-trained Transformer)技術(shù)的認(rèn)識。
利用預(yù)訓(xùn)練模型創(chuàng)作效率高,但總感覺差了點什么?
事實上,在OpenAI備受矚目時,我曾嘗試使用OpenAI撰寫了幾篇文章。首先,我發(fā)現(xiàn)用OpenAI創(chuàng)作的文章閱讀量竟然比我自己的文章還要高,這讓我感到十分驚訝。然而,這些文章雖然內(nèi)容詳實、涵蓋面廣,通用性較強,但我總覺得它們?nèi)鄙倭霜毺氐挠^點和深度。此外,雖然利用預(yù)訓(xùn)練模型準(zhǔn)備資料確實高效便捷,但如果沒有輸入明確的觀點,用預(yù)訓(xùn)練模型生成的文章往往會顯得空洞,缺乏靈魂。
因此,在Deep Seek剛興起時,我對它并不以為然。直到我了解到Deep Seek可以搭建本地知識庫,并通過學(xué)習(xí)知識庫中的知識來提升其創(chuàng)作能力。通過根據(jù)自己的知識框架對模型進行訓(xùn)練,再用訓(xùn)練好的模型進行創(chuàng)作,這樣生成的文章才能更具差異性和深度。
知識架構(gòu)對認(rèn)知理解非常重要
不久前,我參與了一場關(guān)于“S&OP是計劃還是流程”的辯論。其實,觀點的差異很大程度上源于我和辯論對手在知識架構(gòu)上的不同。我的辯論對手認(rèn)為計劃具有強邏輯性,我推測她可能將計劃理解為ERP普及后,受ERP系統(tǒng)影響的軟件系統(tǒng)的計劃功能,這只是Planning概念的一個分支。
而我的知識架構(gòu)則是基于APICS和SCOR框架的。APICS對Planning的定義是:為組織設(shè)定目標(biāo)并選擇各種方式來使用組織的資源以實現(xiàn)這些目標(biāo)的流程。這個定義本身就包含了Process(流程)的含義,即制定計劃的流程。而在SCOR早期版本中,供應(yīng)鏈包含的26個流程分別屬于計劃、執(zhí)行和使能三類。如果S&OP流程不屬于計劃,那么它就應(yīng)該屬于執(zhí)行或使能類別。從這個邏輯出發(fā),如果認(rèn)為S&OP不是計劃就不言而喻了。
如果GPT在訓(xùn)練模型時沒有區(qū)分知識架構(gòu)的重要性,當(dāng)提供的多種知識架構(gòu)中存在矛盾時,GPT輸出的內(nèi)容質(zhì)量就無法得到保證。因此,我希望能夠用自己的知識框架來訓(xùn)練模型進行創(chuàng)作,這樣才有意義。
最近幾天,我一直在努力搭建自己的本地知識庫??上У氖?,docker+dify+deep seek的環(huán)境搭建過程并不順利,花費了我兩天的時間才終于搭建成功。今天早上,我終于成功搭建了AnythingLLM+deep seek的知識庫。接下來,我計劃在幾天內(nèi)將一些重要的供應(yīng)鏈知識框架加入知識庫,然后再利用Deep Seek創(chuàng)作內(nèi)容,看看效果如何。