四色草视频-四散的尘埃在线观看-四库国产精品成人-四虎最新网址入口-国产精品一区二区三区四区五区-国产精品一区二区三区四区

對話科大訊飛劉慶峰:大模型競爭,要有科學精神也要有“警戒線”丨大道直行

2023-05-18 16:36:16   來源:新浪科技   評論:0   [收藏]   [評論]
導讀:  截至目前,國內已有超40個大模型正籌備研制或已經推出,越來越卷的大模型競賽,似乎也正在演變為新一輪算力、數據以及算法競爭的燒錢大戰,各家都在宣揚著自己的大模型能力出眾、性能卓越,但最終真實情況如
  截至目前,國內已有超40個大模型正籌備研制或已經推出,越來越“卷”的大模型競賽,似乎也正在演變為新一輪算力、數據以及算法競爭的“燒錢”大戰,各家都在宣揚著自己的大模型能力出眾、性能卓越,但最終真實情況如何,外界難以評判。

  越來越卷的國內大模型競賽,究竟是好事還是壞事?企業該如何理性地參與這場競賽?近日,科大訊飛(61.190, 2.86, 4.90%)星火大模型發布,在接受新浪財經《大道直行》采訪時,科大訊飛董事長劉慶峰給出了自己的答案,在他看來,“百花齊放是好事,但也需要建立一套客觀科學的大模型評價體系,讓大家知道誰好誰壞,避免一窩蜂而上導致的魚龍混雜,對外界形成誤導。”

  “大模型進步中,會有許多毛病”

  ChatGPT發布后短短半年內,國內已經涌現出超40余支大模型團隊,從阿里、百度、360等底蘊雄厚的互聯網大廠,到科大訊飛、云從科技(41.800, 1.57, 3.90%)等AI科技企業,再到王慧文、王小川等明星高管帶隊的初創團隊,以及中科院自動化所、智源研究院等“學院派”大模型隊伍,越來越多的大模型團隊正不斷涌現。

  然而,繁榮之下,愈演愈烈的大模型競賽,也正在不斷催生出新的數據孤島、算力浪費以及人才內耗等問題。與此同時,一些企業團體不斷通過輿論手段混淆視聽,干擾大眾認知以及行業判斷的行為,也正滋生著新的混亂。

  在劉慶峰看來,“當前國內大模型百花齊放的狀態是一件好事,畢竟,我們需要擁抱這一次通用人工智能的機會。”但在擁抱的同時,我們也應該尊重一些基本的倫理價值和法律底線,涉及數據安全、個人隱私以及國家安全等相關問題的,需要有一定的“警戒線”。

  與此同時,劉慶峰還指出,“隨著越來越多的企業參與到大模型研究當中,行業需要有一個相對客觀的系統性評價方法,在對企業自己的大模型研究發展進行指導的同時,也讓外界看到不同模型之間的差異與特色,進而幫助開發者、客戶、行業監管乃至于媒體公眾,進行自發的遴選評測。”

  “認知大模型推出的時間并不長,即便是ChatGPT和GPT4,也在快速進步中,它們也有許多毛病和問題,如果隨便找一個例子來評測并說自己的大模型做得好,這其實是片面的,可能只是為了營銷或者其他目的的誤導。”

  據劉慶峰介紹,在成立了訊飛星火大模型專項工作組初期,科大訊飛所做的第一件事情,就是根據ChatGPT的48個主要任務指令進行系統性的評價,并據此提出大模型研發需求。在新近公布的通用人工智能評價方式中,科大訊飛提出了包括文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力在內的7大維度481項大模型評測體系。

  在他看來,我們一定是要把通用人工智能的評價標準拿出來,這既能夠對我們自己的大模型研究做到什么程度起到指導,讓我們知道自己的進步和缺點。同時這也是拿來給開發者、客戶、行業監管以及公眾看的,讓他們能夠知道從哪些維度進行評測,并做出自己的選擇判斷。

  “做認知大模型的企業,大部分都是龍頭企業,都可能有一批跟隨者或者資本關注者,還是要有科學的精神,腳踏實地的態度,來給大家把大模型究竟是怎么回事把它解析出來。否則就會一窩蜂上,也不知道誰好誰壞、進步方向在哪。”劉慶峰表示。

  據他介紹,基于自主提出的7維度481項大模型評測體系,科大訊飛對最新發布的星火大模型進行了每維度10個左右的案例測試,訊飛星火在語言理解和知識問答方面已接近ChatGPT處于國內領先水平,“5分制ChatGPT能到4.48分,而訊飛星火大模型已經達到4.29分”。

  “有兩件事情值得注意”

  劉慶峰認為,這一次認知大模型的發展,能夠在工業互聯網領域會形成巨大的突破和機會,有力地推動萬物互聯時代的到來。幾年前,外界一致認為IT產業將從以手機為代表的移動互聯網,發展到以穿戴設備等為代表的萬物互聯階段,但由于人機交互模式以及機器人(16.650, 2.57, 18.25%)語言理解能力的不足,這一天遲遲沒能快速到來。

  “但今天已經不一樣了,基于大模型的人工智能技術已經具備通用領域的智慧涌現、觸類旁通能力,這將帶來萬物互聯這個產業的巨大的機會。”劉慶峰表示。

  在他看來,人類智慧的產生可能有兩種模式。第一,類似于牛頓范式,所有事情都能講得清清楚楚,寫出萬有引力公式并據此計算出九大行星如何繞地運行、宇宙飛船如何飛上天。另一種則是生物神經網絡,基于海量模型參數形成記憶后帶來的學習認知觸類旁通能力。劉慶峰實測發現,“這一次基于大模型技術的通用人工智能技術,確實已經具備智慧涌現的能力,原來我們還不敢輕易提的通用人工智能確實已經到來,星星之火開始顯現。”

  “雖然目前我們仍不清楚大模型為什么會具備‘智慧涌現’的能力,但我們可以通過在大模型訓練學習階段加入人為的選擇和價值判斷,保證它學得更對,最終更加符合我們的要求。”劉慶峰表示。

  在劉慶峰看來,做大模型應用的企業,有兩件事情值得注意。第一,特別敏感、關鍵的應用,應該建立在自主可控的硬件平臺之上,這才是長期之道。第二,做大模型應用時,需要看準目標市場,遵循國家法律,同時自己心中帶著人工智能不是代替人類,是幫助人類的這樣一個基本倫理和價值觀,這樣才能越做越好。

  隨著越來越多的大模型產品技術不斷涌現,未來真正有價值的認知大模型,將是以解決社會剛需問題為導向的,擁有正確價值觀,并且能夠在具備社會剛需的應用場景落地大模型的企業,也將最先能形成良性的自我造血能力。

分享到:
責任編輯:zsz

網友評論