http://m.sharifulalam.com 2025-02-14 14:54 來源:CAICT上海工創中心
2025年1月13-24日,國際電信聯盟電信標準分局第二十一研究組(ITU-T SG21)于瑞士日內瓦召開全體會議。由中國信息通信研究院(簡稱“中國信通院”)牽頭的10個結項項目、5個新立項項目和1個文稿更新項目順利通過。
其中,結項標準圍繞數據標注、云平臺建設、模型測評等多個大模型產業化環節展開,聚焦智能體感知評估、機器人流程自動化、代碼生成、駕駛員行為檢測等應用領域,標志著中國在大模型國際標準領域取得了突破性進展,推動了人工智能及相關技術標準的實現。
結合中國信通院與ITU官網發布內容,中國信通院上海工創中心對10項結項標準的已公開內容進行了梳理匯總。
01 Technical specification forartificial intelligence cloudplatform:Data annotation
人工智能云平臺技術規范:數據標注
標準從人工智能數據標注全流程的角度出發,共分為數據接入、數據標注、智能標注、數據交付和生產管理五個部分。
簡介 / INTRODUCTION
由于數據標注在改進人工智能算法模型訓練中的作用,其重要性正日益受到關注。因此,評估數據標注的能力非常重要。本提案概述了人工智能云平臺數據標注能力的一般要求,這些要求有助于行業參與者分析和優化其產品,同時也幫助用戶構建和選擇符合這些要求的產品。
02 Technical requirements andevaluation methods of AI-baseddriver behaviour detectionapplication
駕駛員行為檢測應用的技術要求與評估方法
標準以駕駛員行為檢測為核心,明確行為檢測應用通用框架,涵蓋數據輸入、數據預處理、計算與決策及輸入等模塊,規范其可檢測的行為狀態及通用檢測方法和檢測流程。
概要 / SUMMARY
駕駛員行為檢測是車輛駕駛安全助手系統中最重要的部分之一。它有助于防止人類引起的安全風險,并大大減少嚴重事故的發生。因此,如何實現成熟的駕駛員行為檢測應用程序引起了公眾的關注。需要考慮駕駛員,汽車和環境之間的信息和連接,以在現實的駕駛場景中充分了解駕駛員行為。該項目主要關注使用車輛中的計算機視覺的駕駛員行為應用程序。該建議旨在為駕駛員行為檢測應用提供一種一般框架,要求和評估方法,并幫助公司和行業增強對多媒體應用程序上駕駛員行為檢測的開發。
03 Framework andrequirements for the foundationmodel platform
基礎模型平臺框架與要求
標準圍繞大模型的數據工程、模型預訓練模型調優、模型交付、模型運營、平臺能力和監控七個維度,構建了面向大模型全生命周期的功能要求框架,以及各維度的能力要求。
概要 / SUMMARY
多媒體中的基礎模型平臺旨在解決應用程序障礙,資源和計算能力需求以及復雜的內容生產過程。它為多媒體應用提供了AI功能。該基礎模型平臺框架的表述填充了多媒體領域中基礎模型的平臺標準的真空,幫助生產者企業指導產品研究并標準化其基礎模型平臺的構建,并為企業用戶選擇基礎模型平臺產品提供參考。
04 Assessment criteria for foundation models:Benchmark
基礎模型的評估標準:
基準測試標準提供了大模型基準評測的參考架構、技術要求和評估方法,包括測試能力、測試數據集、測試方法以及測試工具四個部分。概要 / SUMMARY該建議著重于基礎模型的要求和評估方法。它涵蓋了基礎模型基準的概述,并確定了基礎模型的要求和評估方法。這對于確保不同基礎模型的一致性,透明度和可比性,實現公平評估并明智的決策很重要。它可以幫助行業參與者分析和優化基礎模型,并幫助用戶構建和選擇與這些要求保持一致的產品。
05Technical requirements and evaluation methods of Al based codegeneration in multimedia applications
多媒體應用中基于AI的代碼生成技術要求及評價方法
標準圍繞代碼大模型相關的通用能力、專用場景能力和應用成熟度,從輸入多樣性、任務多樣性、語言完備度、結果可接受性、結果準確度等維度,提出了全棧技術要求和評估方法。
概要 / SUMMARY
該建議制定基于基礎模型的代碼生成技術要求和評估方法。它旨在指導代碼生成能力構建,并提供一般用戶指南。
06 Requirements and evaluation methods of artificial intelligence agents based on large scale pre-trained model
基于大模型的智能體能力要求與評估方法
標準主要涉及評估智能體感知和認知、規劃、記憶和執行的功能和性能能力。從智能體實際應用出發,部分涉及智能體與智能體群、智能體與外部環境間的交互能力。
概要 / SUMMARY
該建議旨在為基于預訓練的智能體提供要求和評估方法的框架。它試圖幫助企業和用戶了解智能體,并幫助他們更快,更準確地構建和實施產品和應用程序。此外,該建議旨在促進行業的健康發展。
07 Functional capabilities for artifigial intelligence development within the Al cloud platform: Automated machine learning
人工智能云平臺中面向人工智能開發的功能能力:
自動機器學習標準包括數據處理、模型開發、模型部署以及管理和維護四部分,關注人工智能多媒體應用開發過程中各環節所應具備的自動機器學習技術和算法,以及平臺底層支撐能力。
概要 / SUMMARY
該建議草案側重于AI云平臺內人工智能開發的自動化機器學習(AUTOML)功能,涵蓋了術語,功能和參考設計,以實現面向業務的智能多媒體應用開發。
08 Requirements and evaluation methods for retrieval augmented generation of large scale pre-trained model
大模型檢索增強生成技術要求與評估方法
標準從檢索增強生成流程出發,劃分為數據庫建設、信息檢索、答案生成和應用生態四個階段,分別明確了關鍵能力點,并構建了統一的評估方法
概要 / SUMMARY
標準建立了基于大規模預訓練模型的檢索增強生成技術要求和評估方法的框架,將為用戶更好地了解檢索增強生成技術,并幫助他們更快,適當地設置檢索增強應用程序。
09 The technical requirements and evaluation methods of robotic process automation system
機器人流程自動化系統技術要求與評估方法
標準從RPA系統功能評估的角度出發,劃分為管理監控、開發測試、流程運行和 AI增強四個模塊,涵蓋了系統部署與監控、機器人開發與優化、任務執行與數據收集,以及能力融合的功能要求。
概要 / SUMMARY
該建議提供了機器人流程自動化系統的技術要求和評估方法,設置了一些評估機器人流程自動化系統功能的關鍵指標。
10 Technical requlrements and assessment methods of generative artificial intelligence enabled multimedia applications
生成式人工智能對多媒體應用服務的技術要求和評估方法(凍結)
標準從技術能力、產品能力、基礎能力、交互能力等多角度,全方位構建了對于生成式人工智能應用的評價體系。此外,針對以下在研標準,中國信通院現面向產、學、研、用各界啟動標準參編征集工作;針對上述結項標準,將依托人工智能關鍵技術和應用評測工業和信息化部重點實驗室“可信AI評測”體系啟動國際標準符合性驗證工作。中國信通院希望攜手各方,持續推進大模型等關鍵領域的國際標準研究制定和實施推廣,促進國際標準研制應用形成有效閉環。