財政部財政資訊中心
參加「2024年國際AI機器學習(ML)大會(ICML 2024)」出國報告
基本資料
系統識別號: |
C11300927 |
相關專案: |
無 |
計畫名稱: |
國際AI機器學習(ML)大會# |
報告名稱: |
參加「2024年國際AI機器學習(ML)大會(ICML 2024)」出國報告 |
電子全文檔: |
C11300927_1.pdf
|
附件檔: |
|
報告日期: |
113/10/21 |
報告書頁數: |
34 |
計畫主辦機關資訊
計畫主辦機關: |
財政部財政資訊中心
|
出國期間: |
113/07/24 至 113/07/30 |
姓名 |
服務機關 |
服務單位 |
職稱 |
官職等 |
鄭仕謙 |
財政部財政資訊中心 |
|
助理程式設計師 |
薦任 |
廖婉淑 |
財政部財政資訊中心 |
|
組長 |
簡任 |
報告內容摘要
國際機器學習會議(ICML)中,探討了關於 LLMs 的幾個主題演講,並深入分析了各演講中所提出的挑戰和解決方案。其中,長文本基礎模型的研討會探討了模型評估、計算效率和數據需求等方面的挑戰。在高效長序列生成的演算法與硬體協同設計的演講中重點分析了鍵值緩存瓶頸問題,並提出了靜態壓縮和動態壓縮兩種技術,最後介紹透過GPU與CPU的協同設計來提升效率。狀態空間模型的權衡分析的演講則探討了狀態空間模型和變換器模型的優缺點,並提出了Mamba模型,結合兩者的優勢。
數據導向機器學習研究的研討會中,則強調了數據集的重要性,探討了數據整理、數據集的著作權以及以數據為中心的視角等問題,並介绍了一些常用的模型和方法。整體而言,這場會議深入淺出地介紹了 LLMs 領域的進展,並分析了相關的技術挑戰和解決方案,為與會者提供了對該領域理解的思考方向。
其他資料
前往地區: |
奧地利; |
參訪機關: |
參加「2024年國際AI機器學習(ML)大會(ICML 2024)」 |
出國類別: |
開會 |
關鍵詞: |
AI,ICML,機器學習,LLMs |
備註: |
|
分類瀏覽