在人工智能領(lǐng)域,盡管現(xiàn)有的尖端大語言模型展現(xiàn)了強大的智能,能夠在多項任務(wù)上匹敵甚至超越人類,但其龐大的參數(shù)規(guī)模帶來的高昂成本一直是企業(yè)和開發(fā)者的痛點。這些模型,動輒擁有數(shù)千億乃至萬億參數(shù),訓(xùn)練、部署及推理費用不菲,對于處理簡單卻需要大規(guī)模和高并發(fā)任務(wù)的企業(yè)而言,可能并非性價比最優(yōu)的選擇。
針對這一現(xiàn)狀,一家名為Fastino的初創(chuàng)公司應(yīng)運而生,他們以低成本高效能為核心,利用低端游戲GPU,以不到10萬美元的平均成本,打造出了一系列“任務(wù)特定語言模型”(TLMs)。這些小型模型在特定任務(wù)上的表現(xiàn)媲美大型語言模型,且推理速度提升了99倍。
近期,F(xiàn)astino宣布獲得由Khosla Ventures領(lǐng)投的1750萬美元種子輪融資,Insight Partners、Valor Equity Partners以及知名天使投資人Scott Johnston和Lukas Biewald也參與其中。加上2024年11月由M12(微軟旗下)和Insight Partners領(lǐng)投的700萬美元前種子輪融資,F(xiàn)astino累計融資已接近2500萬美元。
Fastino由連續(xù)創(chuàng)業(yè)者Ash Lewis(CEO)和George Hurn-Maloney(COO)共同創(chuàng)立。Ash Lewis曾參與創(chuàng)立多家AI原生公司,擁有豐富的行業(yè)經(jīng)驗。公司還組建了一支由谷歌DeepMind、斯坦福大學(xué)、卡內(nèi)基梅隆大學(xué)及蘋果公司人才構(gòu)成的技術(shù)團隊,致力于從底層技術(shù)革新,開發(fā)出高效的任務(wù)特定語言模型。
在AI模型不斷追求更大規(guī)模的背景下,F(xiàn)astino反其道而行之,以低成本、高效率的TLM模型切入市場。這些模型不僅降低了運行成本,還解決了大尺寸模型在特定任務(wù)上性能不突出、推理速度慢的問題。Fastino的聯(lián)合創(chuàng)始人George Hurn-Maloney表示:“AI開發(fā)者需要的不是泛化的大語言模型,而是適合其任務(wù)的精確模型?!?/p>
Fastino的TLM模型專為需要低延遲、高精度AI的應(yīng)用場景設(shè)計,不追求通用性,而是針對特定任務(wù)進行優(yōu)化。這些模型結(jié)合了Transformer的注意力機制,并在架構(gòu)、預(yù)訓(xùn)練和后訓(xùn)練階段引入任務(wù)專精,優(yōu)先考慮緊湊性和硬件適應(yīng)性,同時不犧牲任務(wù)準確性。因此,TLM模型能夠在低端硬件上高效運行,對比OpenAI GPT-4o的4000ms延遲,TLM模型的延遲低至100ms,性能提升顯著。
在性能測試中,F(xiàn)astino的TLM模型在意圖檢測、垃圾信息過濾、情感傾向分析、有害言論過濾、主題分類等基準上,相較于GPT-4o表現(xiàn)出色,F(xiàn)1分數(shù)高出17%。TLM模型還具備文本摘要、函數(shù)調(diào)用、文本轉(zhuǎn)JSON、PII屏蔽、文本分類、臟話過濾和信息提取等多種功能,適用于法律、醫(yī)療、電子商務(wù)等多個行業(yè)。
在收費模式上,F(xiàn)astino采用了訂閱制,對個人開發(fā)者提供每月1萬次免費請求,Pro用戶每月10萬次請求僅需45美元,團隊用戶300萬次請求每月1275美元。這種收費模式對初級開發(fā)者和中小企業(yè)較為友好,降低了AI應(yīng)用的門檻。
Fastino的TLM模型還可部署在客戶的虛擬私有云、本地數(shù)據(jù)中心或邊緣設(shè)備上,保護敏感信息的同時,提供先進的人工智能能力。目前,F(xiàn)astino的TLM模型已在金融、醫(yī)療、電子商務(wù)等多個行業(yè)產(chǎn)生影響,助力企業(yè)優(yōu)化運營、提升效率。
在AI模型追求更大規(guī)模的背景下,F(xiàn)astino憑借低成本、高效率的TLM模型,為企業(yè)和開發(fā)者提供了新的選擇。這一創(chuàng)新不僅降低了AI應(yīng)用的成本,還提升了性能和用戶體驗,為AI行業(yè)的發(fā)展注入了新的活力。