最近一段时间深度学习大模型的重要进展(2022年4月初)
今晚已经是本周的最后一天了,最近的一些深度学习算法方面的进展做个总结吧,感觉都是挺不错的,供大家参考。
一、Chinchilla:更少参数的模型,更好的效果
首先是DeepMind提出的新的关于新的模型大小规律的论文,他们认为可以用较少参数的模型配合一定的数据获得更加优秀的模型性能,所提出的Chinchilla模型,参数700亿,但是性能超于了几千亿参数的Gopher、GPT-3等;

更多参考:https://www.datalearner.com/blog/1051649049249455





