最近一段时间DeepSeek R1可谓是大出风头,火爆全网,据说表现可以和OPEN AI等顶级模型相媲美,训练成本又比其它大模型低廉得很,导致英伟达股票都大跌了呢。
(图源 :pixabay)
话说O哥不是AI领域的专家,这些大模型孰优孰劣完全是一头雾水,基本是就是拿来生成个图片呀,翻译一段英文呀,或者写一段示例代码之类的。
那些免费版已经足够满足我的需求了,可想而知那些收费高达20美元/月(对我而言是一笔巨款)的模型该强大到天际了吧😍?这让我忍不住想去试试。
不过当我打开网页时,却被提示:
Due to large-scale malicious attacks on DeepSeek's services, registration may be busy. Please wait and try again. Registered users can log in normally. Thank you for your understanding and support.
嗯,是了,这两天铺天盖地的新闻和自媒体文章也在说DeepSeeK遭遇大流量DDoS攻击的事情。所谓木秀于林,风必摧之;堆出于岸,流必湍之,行高于人,众必非之,就是这么回事吧?
那么有没有办法在本地运行DeepSeek R1推理模型呢?网上搜了一下,还真有好多方法,最简单的莫过于使用Ollama。
Ollama是啥呢?简单地说就是这些大语言模型的管理工具,它网站上的介绍只有这样一句话:
Get up and running with Llama 3.3, DeepSeek-R1, Phi-4, Gemma 2, and other large language models.
使用起来也是超级简单,下载,安装,使用就可以了。
下载
打开网站首页:
https://ollama.com/
点击Download链接(不得不说,这软件图标设计的别具一格呀)
然后选择对应的版本开始下载就行啦,我选择的Windows版本
安装
下载后电脑里多了这么个安装程序
点击安装即可
貌似也没啥可说的。
使用
使用就更简单了,直接打开Windows命令行窗口,执行ollama命令即可。
它支持如下指令:
我们可以通过以下指令下载并运行R1对应的模型:
ollama run deepseek-r1:8b
如果你电脑上尚未下载过这个模型,它会去拉取这个模型:
deepseek-r1:8b会使用大概4.9G的空间
(如果你电脑空间够大,内存和显存够大,可以去挑战一下deepseek-r1:671b,空间就需要404G,我就不挑战了)
下载完成后,就可以和deepseek-r1对话了,比如让它去翻译呀,去解数学题呀,去进行推理呀,去写代码呀,等等等,这里就不一一演示了。
随便问它个问题,它给我说了一大堆,不过看它思考的过程也挺有意思的
其它
据说现在很多大模型为了应对DeepSeek R1的挑战,纷纷在自家的产品中加入了新功能,或者放宽了对免费用户的各种限制。
(图源 :pixabay)
所以,先不说DeepSeek R1领先程度如何,单单就推动AI大模型发展的竞赛以及对用户友好程度竞赛上,就已经功不可没啦。为它点赞。