期待deepseek R1 – 自己的博客

放假之前只是简单测试了一下deepseek v3，并讨论了一下以他为引擎，结合内嵌模型，构建我们自己的RAG。
放假后看到新闻，deepseek推出了R1引发轰动。由于回来后机器被小子霸占，只是在手机上零星看了一些介绍。
今天早上趁着小子还在睡觉，在电脑上了解了一下情况。Ollama第一时间就推出了相关模型，这样本地部署更为便捷。
我属于看热闹的，看不懂那些高深的数据和图表，但有种感觉，这个deepseek R1所谓的蒸馏，有点类似于AlphaGo zero后的katago，在zero学习的基础上进行了人为知识干预，从而大幅提高了深度学习效率，并避开了诸如征子之类的bug。
不免还是有些期待。

Leave a Reply Cancel Reply