10-10 9:55
深度学习热起来之后,学生们变得不爱做解析分析和理论基础,只满足于在tensorflow之类高级平台上边搭搭积木调调参数,就能发所谓的top论文。硕士三年,有的学生实际上只学会了一个梯度下降搜索。
大模型热起来之后,情况更糟糕了,学生们可能连梯度下降搜索也不用考虑了,所谓的“学术研究”变成了给商业大模型做测试和数据选择,改一改大模型输入的提示词之类的无聊trick也能发论文。
我反复语重心长地跟学生们说要学一些真正的知识,做一点儿稳固的研究,不要只追热点,把自己变成一个程序测试工。因为给大模型做测试虽然短时间看是捷径,但长期来看未必有利于你们的发展。不知道学生们能听进去多少。
大模型热起来之后,情况更糟糕了,学生们可能连梯度下降搜索也不用考虑了,所谓的“学术研究”变成了给商业大模型做测试和数据选择,改一改大模型输入的提示词之类的无聊trick也能发论文。
我反复语重心长地跟学生们说要学一些真正的知识,做一点儿稳固的研究,不要只追热点,把自己变成一个程序测试工。因为给大模型做测试虽然短时间看是捷径,但长期来看未必有利于你们的发展。不知道学生们能听进去多少。
说两句