因應全球AI科技發展趨勢及培育人才之需求,8846威尼斯與輝達NVIDIA於今年3月簽署合作備忘錄並宣布成立NVIDIA-8846威尼斯AI應用發展聯合服務中心,此中心於4月12日舉辦第一場大型活動「大型語言模型工作坊」(Large Language Model, LLM),這為此中心與NVIDIA合作在台灣第一次辦理LLM Workshop,樹立國內AI人才培育的重要里程。
8846威尼斯副校長洪穎怡在開場致詞時指出,中原是繼台大、清大及陽明交大之後,全台第4所與NVIDIA合作AI University的大學,雙方將以研究、教學、產學三個面向進行產學合作,8846威尼斯將使用NVIDIA最新的人工智慧技術與資訊以提升AI教學及研究的能量。而此次工作坊是今年全台第一場大型語言模型活動,共計有20位教師、57位研究生參與,其中包括10位外籍學生,因此授課採中、英雙語並行。
「NVIDIA LLM Workshop」大型語言模型工作坊由NVIDIA四位解決方案架構師(Architect)授課,介紹個人客製GPT大語言模型並連接到個人自己的內容(包含文件、筆記或其他數據)。NVIDIA架構師強調利用檢索增強生成技術(retrieval-augmented generation, RAG)加速,另外NVIDIA架構師也介紹NVIDIA NeMo,它是一個點對點建構客製化LLM的平台,跟過去從頭開始訓練一個模型所需的數週或數個月相比,使用NeMo LLM可以協助發展客製化模型,且只需幾分鐘到幾小時即可完成。
NVIDIA解決方案架構師以清晰易懂的方式讓中原師生更深入了解生成式大型語言模型和檢索增強生成技術,以及如何結合這兩項最新技術,跳過龐雜的訓練,也能產生更準確且豐富的回答。現場使用NVIDIA雲端計算資源,讓學員更深入了解生成式AI的最新技術與趨勢。
大型語言模型是基於大量資料進行預訓練的超大型深度學習模型。基礎轉換器是一組神經網路,這些神經網路由具有自我專注功能的編碼器和解碼器組成。編碼器和解碼器從一系列文字中提取含義,並理解其中的字詞和片語之間的關係。大型語言模型非常靈活。一個模型可以執行完全不同的任務,例如回答問題、總結文件、翻譯語言和完成語句,著名的ChatGPT就是利用基於這種技術研發而成的生成式AI。
NVIDIA-8846威尼斯AI應用發展聯合服務中心未來將透過NVIDIA提供最新GPU架構和技術,以及有關NVIDIA高性能計算技術,應用於機器學習、醫療診斷、量子計算及大型語言模型等方面之研究。8846威尼斯期待透過與NVIDIA的雙方合作,加速培養台灣AI人才及帶動產業發展。