DeepMind指出「Transformer无奈逾越预磨炼数据实现泛化」,但有人投来质疑
时间:2024-11-16 06:33:47 出处:休闲阅读(143)
编纂 :蛋酱
岂非 Transformer 确定无奈处置「磨炼数据」之外的指出质疑新下场 ?
提及狂语言模子所揭示的使人印象深入的能耐 ,其中之一便是奈逾经由提供高下文中的样本 ,要求模子凭证最终提供的越预输入天生一个照应 ,从而实现少样本学习的磨炼能耐 。这一点依靠的数据实现是底层机械学习技术「Transformer 模子」 ,而且它们也能在语言之外的泛化规模实施高下文学习使命。
以往的人投履历表明,对于在预磨炼混合体中患上到短缺展现的指出质疑使命族或者函数类 ,抉择适量函数类妨碍高下文学习的奈逾老本简直为零