近期,國內(nèi)大模型市場迎來了一波新的創(chuàng)新熱潮,多家廠商紛紛推出迭代產(chǎn)品,其中多模態(tài)領(lǐng)域尤為引人注目。自年初Sora發(fā)布后,國產(chǎn)文生視頻大模型的進(jìn)展備受關(guān)注。8月底,MiniMax推出了首個(gè)AI高清視頻生成模型,緊接著9月,豆包發(fā)布了兩款視頻生成大模型,并獲得灰測用戶的高度評價(jià)。與此同時(shí),科大訊飛也宣布將發(fā)布多模態(tài)視覺交互及超擬人虛擬人交互能力。然而,在這些新產(chǎn)品中,一款名為Kimi探索版的工具尤為引人關(guān)注。
Kimi探索版被視為國內(nèi)對標(biāo)OpenAI“推理時(shí)計(jì)算”能力o1的產(chǎn)品。據(jù)官方介紹,它能夠模擬人類的推理思考全過程,執(zhí)行深度搜索并反思改進(jìn)結(jié)果,從而提供更加全面和準(zhǔn)確的答案。這一特性使其在眾多大模型中脫穎而出。Kimi探索版的產(chǎn)品負(fù)責(zé)人甚至表示,如果Kimi搜不到的信息,用戶也很難通過傳統(tǒng)搜索引擎找到。
那么,Kimi探索版究竟有何獨(dú)特之處?它在技術(shù)上是如何實(shí)現(xiàn)模擬人類推理和思考的呢?官方解釋,Kimi探索版通過自主規(guī)劃策略,將復(fù)雜問題分解為層次化的子問題,然后分步執(zhí)行,這與OpenAI的o1模型所采用的馬爾可夫決策過程相似。這使得Kimi探索版在處理需要多步推算判斷的問題時(shí),表現(xiàn)出更強(qiáng)的能力。
為了驗(yàn)證Kimi探索版的能力,我們進(jìn)行了一項(xiàng)測試。提出問題:“假設(shè)我在2024年9月2日有100000元,對比一下截至9月30日,購買騰訊港股和購買貴州茅臺哪個(gè)方案的收益率更高?具體收益額會高出多少?”Kimi探索版將這個(gè)問題分為了查詢、計(jì)算和結(jié)論三個(gè)步驟,最終給出了詳細(xì)的答案和解釋。
Kimi探索版還具備即時(shí)反思搜索結(jié)果、補(bǔ)充信息的能力。面對開放探索型問題,如果第一次回答的信息存在缺失,它會主動補(bǔ)充更多回答。面對數(shù)字相關(guān)的搜索問題,如果發(fā)現(xiàn)了數(shù)據(jù)沖突,它會及時(shí)提供多方視角的信息供參考決策。這一特性使其在搜索結(jié)果的準(zhǔn)確性和全面性上更具優(yōu)勢。
盡管Kimi探索版在技術(shù)和功能上取得了顯著突破,但仍存在一些需要正視的問題。其中之一是其在處理不同問題時(shí),搜索的網(wǎng)頁數(shù)量存在差異,導(dǎo)致結(jié)果的不一致性。這引發(fā)了對于技術(shù)、環(huán)境或算力因素的疑問。在處理特定類型的問題時(shí),如數(shù)英文單詞中字母“e”的數(shù)量,Kimi探索版仍存在一些錯(cuò)誤。
盡管如此,Kimi探索版的出現(xiàn)仍然具有重要意義。它改變了過去大模型需要繁瑣提示詞才能輸出想要結(jié)果的情況,通過模擬人類的推理思考過程,提供了更加全面和準(zhǔn)確的答案。這為用戶節(jié)省了搜索調(diào)研任務(wù)上的時(shí)間,使其能夠更專注于提出問題、思考和創(chuàng)造。未來,隨著技術(shù)的不斷完善和用戶體驗(yàn)的提升,Kimi探索版有望在國內(nèi)AI搜索與大模型發(fā)展領(lǐng)域發(fā)揮更加重要的作用。