近日,OpenAI聯合創始人兼CEO Sam Altman,談到了目前LLM(Large Language Model,大語言模型)未來的發展。Altman在采訪中指出,目前人類已經在接近LLM規模的極限,模型的規模大小將不再是評價模型好壞的重要指標,提升模型的能力與效用將更加重要。
ChatGPT席卷電子業,包括昆侖萬維、知乎、亞馬遜、百度與商湯科技等在內的國內外廠商,分別推出各自的大語言模型,迅速行程內卷之勢。與ChatGPT功能對標的大語言模型,目前國外主要有Google推出的Gopher、LaMDA以及Meta的Llama等;
國內為百度首發的“文心一言”、360發布的大語言模型、阿里發布的“通義千問”、商湯發布的“商量”等。
所以,大語言模型的盡頭是什么?又該如何判定一款大語言模型的好壞呢?
Sam將LLM的發展與曾經芯片速度的競賽進行了比較,表示就像目前人們比起單純的速度,更在意芯片能否完成任務一樣,LLM的規模也將逐漸變得不是那么重要。
而對于中國廠商而言,能否實現趕超ChatGPT?
雖從對話和文本生成的直觀體驗看ChatGPT略勝一籌,但對于Google等國外大廠而言,克隆ChatGPT并不存在太高壁壘。
來自艾瑞咨詢的觀點,當前暫時落后主要是出于公司戰略與技術理念差異,選擇了不同技術路線,隨著各家探索成果和新技術方法的實踐不斷推進,仍存在對GPT系列模型趕超的可能。
對百度等國內大廠而言,則在數據、算力、工程化能力等關鍵要素上存在短板,短期內難以對國外領先大模型實現趕超,為跟隨者角色,長期更需要國內AI全產業鏈整體進化。