放假之前只是简单测试了一下deepseek v3,并讨论了一下以他为引擎,结合内嵌模型,构建我们自己的RAG。
放假后看到新闻,deepseek推出了R1引发轰动。由于回来后机器被小子霸占,只是在手机上零星看了一些介绍。
今天早上趁着小子还在睡觉,在电脑上了解了一下情况。Ollama第一时间就推出了相关模型,这样本地部署更为便捷。
我属于看热闹的,看不懂那些高深的数据和图表,但有种感觉,这个deepseek R1所谓的蒸馏,有点类似于AlphaGo zero后的katago,在zero学习的基础上进行了人为知识干预,从而大幅提高了深度学习效率,并避开了诸如征子之类的bug。
不免还是有些期待。