實(shí)測Kimi探索版，中國版“o1大模型”來了？

發(fā)布時(shí)間：2024-10-16 17:12 來源：ITBEAR 作者：陸辰風(fēng)

近期，國內(nèi)大模型市場迎來了一波新的創(chuàng)新熱潮，多家廠商紛紛推出迭代產(chǎn)品，其中多模態(tài)領(lǐng)域尤為引人注目。自年初Sora發(fā)布后，國產(chǎn)文生視頻大模型的進(jìn)展備受關(guān)注。8月底，MiniMax推出了首個(gè)AI高清視頻生成模型，緊接著9月，豆包發(fā)布了兩款視頻生成大模型，并獲得灰測用戶的高度評價(jià)。與此同時(shí)，科大訊飛也宣布將發(fā)布多模態(tài)視覺交互及超擬人虛擬人交互能力。然而，在這些新產(chǎn)品中，一款名為Kimi探索版的工具尤為引人關(guān)注。

Kimi探索版被視為國內(nèi)對標(biāo)OpenAI“推理時(shí)計(jì)算”能力o1的產(chǎn)品。據(jù)官方介紹，它能夠模擬人類的推理思考全過程，執(zhí)行深度搜索并反思改進(jìn)結(jié)果，從而提供更加全面和準(zhǔn)確的答案。這一特性使其在眾多大模型中脫穎而出。Kimi探索版的產(chǎn)品負(fù)責(zé)人甚至表示，如果Kimi搜不到的信息，用戶也很難通過傳統(tǒng)搜索引擎找到。

那么，Kimi探索版究竟有何獨(dú)特之處？它在技術(shù)上是如何實(shí)現(xiàn)模擬人類推理和思考的呢？官方解釋，Kimi探索版通過自主規(guī)劃策略，將復(fù)雜問題分解為層次化的子問題，然后分步執(zhí)行，這與OpenAI的o1模型所采用的馬爾可夫決策過程相似。這使得Kimi探索版在處理需要多步推算判斷的問題時(shí)，表現(xiàn)出更強(qiáng)的能力。

為了驗(yàn)證Kimi探索版的能力，我們進(jìn)行了一項(xiàng)測試。提出問題：“假設(shè)我在2024年9月2日有100000元，對比一下截至9月30日，購買騰訊港股和購買貴州茅臺哪個(gè)方案的收益率更高？具體收益額會高出多少？”Kimi探索版將這個(gè)問題分為了查詢、計(jì)算和結(jié)論三個(gè)步驟，最終給出了詳細(xì)的答案和解釋。

Kimi探索版還具備即時(shí)反思搜索結(jié)果、補(bǔ)充信息的能力。面對開放探索型問題，如果第一次回答的信息存在缺失，它會主動補(bǔ)充更多回答。面對數(shù)字相關(guān)的搜索問題，如果發(fā)現(xiàn)了數(shù)據(jù)沖突，它會及時(shí)提供多方視角的信息供參考決策。這一特性使其在搜索結(jié)果的準(zhǔn)確性和全面性上更具優(yōu)勢。

盡管Kimi探索版在技術(shù)和功能上取得了顯著突破，但仍存在一些需要正視的問題。其中之一是其在處理不同問題時(shí)，搜索的網(wǎng)頁數(shù)量存在差異，導(dǎo)致結(jié)果的不一致性。這引發(fā)了對于技術(shù)、環(huán)境或算力因素的疑問。在處理特定類型的問題時(shí)，如數(shù)英文單詞中字母“e”的數(shù)量，Kimi探索版仍存在一些錯(cuò)誤。

盡管如此，Kimi探索版的出現(xiàn)仍然具有重要意義。它改變了過去大模型需要繁瑣提示詞才能輸出想要結(jié)果的情況，通過模擬人類的推理思考過程，提供了更加全面和準(zhǔn)確的答案。這為用戶節(jié)省了搜索調(diào)研任務(wù)上的時(shí)間，使其能夠更專注于提出問題、思考和創(chuàng)造。未來，隨著技術(shù)的不斷完善和用戶體驗(yàn)的提升，Kimi探索版有望在國內(nèi)AI搜索與大模型發(fā)展領(lǐng)域發(fā)揮更加重要的作用。

更多>同類內(nèi)容