久久久91-久久久91精品国产一区二区-久久久91精品国产一区二区三区-久久久999国产精品-久久久999久久久精品

最新廣告
關(guān)注中國自動(dòng)化產(chǎn)業(yè)發(fā)展的先行者!
工業(yè)智能邊緣計(jì)算2025年會(huì)
CAIAC 2025
2025工業(yè)安全大會(huì)
OICT公益講堂
當(dāng)前位置:首頁 >> 資訊 >> 行業(yè)資訊

資訊頻道

為通用人工智能搭建新測試體系
  • 點(diǎn)擊數(shù):1037     發(fā)布時(shí)間:2023-12-27 23:20:23
  • 分享到:
在建構(gòu)人工智能評測系統(tǒng)方面,早在1950年,英國計(jì)算機(jī)科學(xué)家阿蘭·圖靈就提出了基于行為的圖靈測試:如果一臺(tái)機(jī)器能夠與人類展開對話而不被人類辨別出其機(jī)器身份,則稱這臺(tái)機(jī)器通過了測試。

近來,大模型技術(shù)引發(fā)了全球?qū)νㄓ萌斯ぶ悄艿膹V泛關(guān)注,在產(chǎn)業(yè)界、科研界掀起了巨大熱潮。在人工智能技術(shù)大顯身手、取得矚目成就的同時(shí),如何應(yīng)對技術(shù)跨越所帶來的風(fēng)險(xiǎn)并進(jìn)行管控與治理,如何判斷人工智能系統(tǒng)是否具備通用人工智能的性能等,也日益成為各方關(guān)注的焦點(diǎn)。在筆者看來,當(dāng)下,我國科學(xué)界和產(chǎn)業(yè)界要抓住這一歷史機(jī)遇,明確通用人工智能的發(fā)展路徑和方向,牢牢把握解讀和評估通用人工智能的話語權(quán),盡快搭建并完善通用人工智能測試評級標(biāo)準(zhǔn)與平臺(tái)。

在建構(gòu)人工智能評測系統(tǒng)方面,早在1950年,英國計(jì)算機(jī)科學(xué)家阿蘭·圖靈就提出了基于行為的圖靈測試:如果一臺(tái)機(jī)器能夠與人類展開對話而不被人類辨別出其機(jī)器身份,則稱這臺(tái)機(jī)器通過了測試。人工智能發(fā)展至今,現(xiàn)有的人工智能測試體系各自所呈現(xiàn)出的局限性,已無法滿足通用人工智能的研究訴求:圖靈測試不足以準(zhǔn)確衡量人工智能的智能程度、任務(wù)導(dǎo)向測試(俗稱“刷榜”),可能導(dǎo)致人工智能過度適應(yīng)某項(xiàng)特定任務(wù),當(dāng)前很多基于Unity(一種實(shí)時(shí)三維互動(dòng)內(nèi)容創(chuàng)作和運(yùn)營平臺(tái))的虛擬環(huán)境測試則在模擬復(fù)雜物理交互方面有所欠缺……顯然,傳統(tǒng)的人工智能測試已不適用于通用人工智能系統(tǒng)的評級。

另外,很多應(yīng)用者反映,當(dāng)下熱門的大模型常常出現(xiàn)“腦霧”與“認(rèn)知眩暈”等現(xiàn)象,在產(chǎn)業(yè)落地中出現(xiàn)問題。歸根結(jié)底,是因?yàn)檫@種基于數(shù)據(jù)驅(qū)動(dòng)的大模型仍然缺“心”,缺乏明確的認(rèn)知架構(gòu)和價(jià)值體系,只能按照人類設(shè)定的程序,機(jī)械地對問題進(jìn)行反饋,求解“填空題”。這也倒逼通用人工智能測試之“心”要具備兩個(gè)結(jié)構(gòu):其一為價(jià)值體系,具備符合人類價(jià)值觀的通用智能體,才能被廣泛接納;其二為認(rèn)知架構(gòu),這是通用智能體與人交流、合作的基礎(chǔ)。價(jià)值體系、認(rèn)知架構(gòu)不僅應(yīng)是驅(qū)動(dòng)通用人工智能自主任務(wù)生成的根本內(nèi)驅(qū)力,也是保障通用人工智能安全運(yùn)轉(zhuǎn)的關(guān)鍵。智能體只有具備了“良知”的知識(shí)體系及可以與人類溝通解釋的“認(rèn)知架構(gòu)”,才能形成人機(jī)信任關(guān)系,實(shí)現(xiàn)人機(jī)和諧共生。

針對科學(xué)測試人工智能所需的種種條件,近期,筆者帶領(lǐng)團(tuán)隊(duì)依據(jù)發(fā)展心理學(xué)和心智理論,參考人類嬰幼兒發(fā)育的測試標(biāo)準(zhǔn),研究總結(jié)出一種基于能力和價(jià)值的通用人工智能評測方法,并開發(fā)了復(fù)雜動(dòng)態(tài)的物理場景(模擬仿真)和社會(huì)交互(混合現(xiàn)實(shí))的測試平臺(tái)——通智測試。這項(xiàng)成果于今年8月發(fā)表在中國工程院院刊《工程(英文)》上,這也是該領(lǐng)域發(fā)布的全球首個(gè)評級測試標(biāo)準(zhǔn)與平臺(tái)。

該測試強(qiáng)調(diào)在復(fù)雜動(dòng)態(tài)的物理及社會(huì)環(huán)境中,通用人工智能系統(tǒng)(智能體)應(yīng)滿足三個(gè)基本標(biāo)準(zhǔn):

一是能完成無限任務(wù)并具備任務(wù)泛化能力,不依賴人類定義和訓(xùn)練任務(wù)。任務(wù)被定義為智能體對物理世界屬性(如顏色、位置、速度等)或社會(huì)狀態(tài)(如感知、認(rèn)知、決策、心智等)狀態(tài)的改變。人類在與外界交互時(shí)會(huì)產(chǎn)生無限可能,通用智能體需在這些場景中理解人類意圖、與人協(xié)作,其任務(wù)和運(yùn)動(dòng)的規(guī)劃必須符合物理因果與社會(huì)規(guī)范。

二是能根據(jù)變化的場景自主生成任務(wù),不依賴于人類分配任務(wù),做到俗話說的“眼里有活”。反之,如果智能體只能執(zhí)行人類提前設(shè)定好的任務(wù),不論是基于規(guī)則或者統(tǒng)計(jì)模型,既不能對預(yù)設(shè)之外的任務(wù)做到自主定義,也無法在與陌生環(huán)境交互中自動(dòng)生成新任務(wù),并不能適應(yīng)人類社會(huì)的動(dòng)態(tài)性與多樣性。

三是由價(jià)值驅(qū)動(dòng)并具有自我意識(shí)和層次化的價(jià)值體系。智能體能夠自主生成并完成符合人類需求的任務(wù),一套合適的價(jià)值系統(tǒng)至關(guān)重要。這套價(jià)值體系必須融入人類價(jià)值觀,使智能體有能力學(xué)習(xí)和理解人類的價(jià)值偏好,并最終實(shí)現(xiàn)與人類價(jià)值的同向甚至對齊。例如,如果兒童提出不安全的要求,智能體能否識(shí)別出任務(wù)的不合理之處,并自主形成新任務(wù)。

通智測試從智能體探索和認(rèn)知世界規(guī)律的各自感知、認(rèn)知、運(yùn)動(dòng)、交互、社會(huì)、學(xué)習(xí)等能力,以及對自我、他人和群體的價(jià)值理解學(xué)習(xí)這兩個(gè)角度入手,搭建了具體可行的測試平臺(tái)架構(gòu)。測試全面考慮了通用人工智能的關(guān)鍵特征,填補(bǔ)了通用人工智能評測的空白,突破了傳統(tǒng)圖靈測試的方法局限,在人工智能領(lǐng)域具有創(chuàng)新價(jià)值:不但有助于指導(dǎo)研究者為通用人工智能構(gòu)建綜合的設(shè)計(jì)架構(gòu)與完善的評估體系,而且能為人工智能安全治理問題提供積極的解決方案。

在通智測試評估體系下,管理者可針對不同水平的智能體制定差異化監(jiān)管準(zhǔn)入機(jī)制,對通用人工智能規(guī)范化發(fā)展具有參考意義。此外,通智測試評級機(jī)制還可以為通用人工智能的科研路徑提供明晰可靠的路線圖,協(xié)助相關(guān)領(lǐng)域研究者找準(zhǔn)科研道路上的前進(jìn)方向。

來源:《光明日報(bào)》

熱點(diǎn)新聞

推薦產(chǎn)品

x
  • 在線反饋
1.我有以下需求:



2.詳細(xì)的需求:
姓名:
單位:
電話:
郵件:
主站蜘蛛池模板: 国产农村乱色xxxx| 老外黑人一级毛片| 欧洲无线区一二区| 国产做受视频激情播放| 美女一级牲交毛片视频| 黑人粗又长| 精品欧美一区二区在线观看 | 热re91久久精品国产91热| 91孕妇精品一区二区三区| 国产精品福利视频手机免费观看| 久草2| 久久成人视| 久久6国产| 九九99热久久精品在线6手机| 麻豆精品国产自产在线| 免费国产草莓视频在线观看黄| 青草青青产国视频在线| 日本一道免费一区二区三区| 日产国产欧美韩国在线| 色5月婷婷| 欧美在线看欧美高清视频免费| 日韩三级一区二区三区| 日韩大胆视频| 欧美亚洲精品一区| 麻豆网站在线看| 久久国产精品免费专区| 久久99精品久久久久久久野外| 九九夜夜| 国产老湿机福利视频在线观看| 国产福利在线视频| 国产72av国片精品jk制服| xxx毛茸茸的亚洲| 福利视频第一区| 黄在线| 国产精品系列在线一区| 国产免费亚洲| 国产一级特黄aa毛片| 欧美一级毛片aaaaa| 色婷婷综合久久久久中文| 在线观看国产免费高清不卡| 亚洲午夜视频|