應(yīng)yl7703永利官網(wǎng)邀請,上海交通大學(xué)許志欽副教授將于2024年8月16-19日訪問蘭州大學(xué),期間舉辦專題學(xué)術(shù)報(bào)告,歡迎全校師生參加。
報(bào)告題目: 現(xiàn)象驅(qū)動(dòng)理解初始化對 Transformer 推理能力的影響
報(bào)告摘要:本報(bào)告關(guān)注現(xiàn)象驅(qū)動(dòng)的深度學(xué)習(xí)的基礎(chǔ)研究,將匯報(bào)頻率原則、凝聚現(xiàn)象等常見現(xiàn)象,理解為什么神經(jīng)網(wǎng)絡(luò)會在過參數(shù)化下呈現(xiàn)好的泛化能力.進(jìn)一步,在凝聚現(xiàn)象的基礎(chǔ)上,我們討論模型初始化對Transformer網(wǎng)絡(luò)的推理能力的影響.
時(shí) 間:2024年8月18日(星期日)11:00.
地 點(diǎn):理工樓631
歡迎廣大師生光臨!
報(bào)告人簡介
許志欽,上海交通大學(xué)自然科學(xué)研究院/數(shù)學(xué)科學(xué)學(xué)院長聘教軌副教授。2012年本科畢業(yè)于上海交通大學(xué)致遠(yuǎn)學(xué)院。2016年博士畢業(yè)于上海交通大學(xué),獲應(yīng)用數(shù)學(xué)博士學(xué)位。2016年至2019年,在紐約大學(xué)阿布扎比分校和柯朗研究所做博士后?,F(xiàn)為Journal of Machine Learning的managing editor。
甘肅應(yīng)用數(shù)學(xué)中心
yl7703永利官網(wǎng)
萃英學(xué)院
2024年8月14日