2025年的春节假期仿佛被按下了加速键,转眼间,大家又回到了各自的工作岗位。要说这个春节什么最火,那绝对是DeepSeek。
几乎在一夜之间,DeepSeek成为了人们关注的焦点。甚至在老家,那些从未接触过AI的亲戚朋友,都在好奇地询问DeepSeek究竟是什么,以及该如何使用。
今天,我们就来深入了解一下DeepSeek。废话不多说,直接进入正题。
1、DeepSeek 到底是什么?
简单来说,DeepSeek
是一款AI大模型,与ChatGPT
、文心一言
、Kimi
等AI工具类似。它既有网页版,也有APP端,方便用户在不同场景下使用。
但真正让DeepSeek脱颖而出、火爆出圈的,是其独特的“深度思考”模式(R1)。
它不仅仅是简单地给出答案,更能够像学霸解题一样,展示出详细的推导、分析和检查过程。相比于那些只是机械地复述信息的普通AI模型,DeepSeek更像是一个真正具备思考能力的智能助手,能够帮助用户更深入地理解问题,并找到解决方案。
2、DeepSeek 公司介绍
DeepSeek(深度求索),是一家成立于2023年7月17日的人工智能公司,其全称为杭州深度求索人工智能基础技术研究有限公司。DeepSeek
也是该公司开发的大模型名称。公司总部位于杭州,是幻方量化旗下的子公司。
DeepSeek
的开发团队由一群年轻且富有才华的优秀毕业生组成。创始人梁文锋是量化投资领域的资深专家,拥有丰富的量化投资经验和深厚的AI技术背景。团队的其他主要成员大多来自清华大学、北京大学和浙江大学等国内顶尖高校。
3、DeepSeek 爆火的原因
DeepSeek之所以能够迅速走红,最主要的原因在于它以极低的成本,打造出了能够与海外巨头相媲美的AI大模型。
虽然 DeepSeek 成立仅一年多,但其应用已经在中美 App Store 登上了免费应用榜首,其应用成果和行业影响力都非常显著:
2024年5月,DeepSeek发布了DeepSeek-V2,正式拉开了中国大模型价格战的序幕。当时,新发布的DeepSeek-V2的API价格仅为GPT-4o的2.7%。随后一周内,国内厂商纷纷跟进,全面降价。
2024年12月,DeepSeek推出的DeepSeek-V3在全球AI领域引起了巨大轰动。它以极低的训练成本(据称不到600万美元),实现了与GPT-4o和Claude Sonnet 3.5等顶尖模型相媲美的性能,震惊了整个业界。自此,“东方的神秘力量”彻底被证实。
时隔不到一个月,2025年1月,DeepSeek再次震撼全球AI圈。与上次不同的是,今年1月份推出的新模型
DeepSeek-R1
不仅成本更低,而且在技术上有了大幅提升。这款新模型延续了其高性价比的优势,仅用十分之一的成本就达到了GPT-o1级别的表现,API定价仅是国内外其他头部AI厂商的几十分之一。DeepSeek R1的出现,犹如一匹黑马,以惊人的姿态闯入AI圈。它不仅让英伟达市值一夜蒸发超过1万亿美元,更是让各路AI大佬瞬间破防。
更重要的是,DeepSeek 还是一个开源模型。没错,DeepSeek-V3
和DeepSeek-R1
模型全部开源。这种开源策略不仅促进了技术生态的发展,还降低了企业的使用成本,从而提高了AI大模型的普及率。同时,开源还意味着:
- 其他国内外大厂可以迅速跟进,开发出自己的类DeepSeek模型。
- 软件公司或个人开发者可以对DeepSeek进行二次开发,打造出自己的DIY版本。目前,已经有很多大厂接入了DeepSeek。
- 不以商业化为第一要义,很多时候能够轻装上阵,专注于技术创新。
在硅谷,像DeepSeek
这样的AI创新并不罕见,但这次是一家中国公司取得了这样的突破,这与传统的“美国创新、中国应用”模式形成鲜明对比,让人格外兴奋。
简单总结一下,OpenAI的GPT-4o模型虽然强大,但其训练成本可能已经高达数亿美元。而DeepSeek仅用了几百万美元,就做出了性能接近的模型。此外,DeepSeek对中文的理解能力极佳,回答也更加自然,不像其他AI那样过于“模板化”,这也是它受欢迎的原因之一。
我还让DeepSeek
列出了GPT-4o
和o1
的对比表格,相信大家可以一目了然。
而R1,可以直接类比o1,两者在跑分上几乎相同。
因此,很多业内人士甚至喊出了“DeepSeek接班OpenAI”的口号。
4、DeepSeek 开源地址
DeepSeek 的相关模型已经开源,以下是不同模型的开源地址:
1、DeepSeek Coder
,它是代码大模型,仓库地址为:
https://github.com/DeepSeek-AI/DeepSeek-Coder
在这个仓库中,你可以找到模型的详细介绍、使用文档、代码示例,以及下载对应的模型权重来开展开发工作。
2、DeepSeek LLM
,它是通用大语言模型,仓库地址为:
https://github.com/DeepSeek-AI/DeepSeek-LLM
这里有关于该模型的架构、训练方法等方面的介绍,同时也提供了模型使用的指引。
3、DeepSeek-R1
,仓库地址:
https://github.com/deepseek-ai/DeepSeek-R1
论文链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
5、DeepSeek 的应用场景
DeepSeek 具有多种强大的功能,主要体现在以下几个方面:
1、高效信息处理与学习
- 知识问答:能够快速解答科学、技术、文化等跨领域的问题,为用户提供即时准确的信息。
- 学术研究:可辅助进行文献综述、术语解释、数据解读等工作,帮助研究者提升效率。
- 语言学习:能够提供语法纠正、翻译练习以及多语言对话训练,助力用户提升语言能力。
2、专业领域辅助
- 编程开发:可以进行代码生成、提供调试建议和算法优化,降低开发者的学习成本,提高开发效率。
- 数据分析:能指导数据清洗、统计方法选择以及提供可视化建议,让非技术用户也能快速上手数据分析。
- 商业决策:能够生成市场分析框架、竞品对比模板等,辅助企业进行初步调研,为商业决策提供支持。
3、创意与内容生产
- 文案创作:可以输出广告语、社交媒体内容、剧本大纲等结构化创意内容,为内容创作者提供灵感和帮助。
- 设计灵感:能够提供用户画像分析、产品命名建议、艺术风格参考等,激发设计师的创意。
4、日常效率工具
- 日程管理:可以拆分复杂任务、生成待办清单,并提供时间管理建议,帮助用户更好地规划和管理时间。
- 个性化助手:能为用户定制旅行攻略、健身计划、饮食方案等,满足用户的个性化需求。
对于大多数人来说,最为常用的有以下几类 AI 使用场景:
- 文案创作(适合自媒体、营销人员):输入“帮我写一篇介绍如何在小红书做副业的文章”,AI 会自动生成高质量的文案,你只需适当调整即可发布。
- 论文辅助(适合学生、研究人员):输入论文大纲,让AI帮你扩写内容或润色语言。
- 代码生成与优化(适合程序员):输入“用Python写一个爬虫,爬取某个网站的文章标题”,AI 会提供完整代码。
- PPT 大纲生成(适合职场人士):输入“帮我整理一份关于AI未来发展的PPT大纲”,AI 会生成清晰的结构。
当然,借助 AI 生产我们所需要的内容时,往往通过多个 AI 工具组合,效果会更佳。例如,用 DeepSeek 写文案,再用 AI 配图工具(如 Midjourney、即梦)制作配图;用 DeepSeek 自动写代码,再用 ChatGPT 优化代码逻辑等。
6、零基础小白入门指南
这部分主要面向新手,老司机可以直接跳过。目前,DeepSeek 有两个使用入口:网页端和 APP。
1、网页端使用非常简单,直接访问官网链接:https://chat.deepseek.com
或 https://ai.com
,使用手机号或微信登录即可。
2、移动端用户可以直接在各大应用商店搜索“DeepSeek”,或者在网页端直接扫码下载:
APP端的操作与网页端基本一致,同样简单易用。
温馨提示:请关闭所有代理,注册时使用国内手机号。这是前人的经验。
在上述对话框中不进行任何操作,默认使用的是 DeepSeek-V3
模型。点击“深度思考”才会切换到 DeepSeek-R1
模型。
3、DeepSeek-V3
和 DeepSeek-R1
在使用上有什么区别呢?
V3 与平时大家使用的 ChatGPT
、文心一言
、Kimi
类似,能够快速处理任务,属于指令型模型。而 R1 则是一种推理模型,AI 会进行深度思考来解决复杂的任务。
这也是 DeepSeek R1
最有价值,以及能够在众多 AI 模型中脱颖而出的原因之一。因为它不仅仅是给出答案,更能够像学霸解题一样,有推导、分析、检查,有完整的思考过程。而且,这个思考过程不带任何个人主观色彩,是非常客观的思考推理过程,能够更好地引导我们向正确的方向思考。
4、在对话框旁边还有一个“联网搜索”按钮,点击后,DeepSeek 就能帮你搜索互联网上的资料,类似于百度搜索。
因为 DeepSeek 默认情况下使用的是几个月前的训练数据,所以如果我们想要参考最新的消息,就需要开启联网搜索,以便联网获取实时信息。
7、指令型 AI vs 推理型 AI
1、指令型 AI
指令型 AI 模型是一种基于预设规则和指令的 AI 模型,它按照给定的指令执行特定的任务。其特点是高度结构化、任务明确、依赖预设规则,并按照指令输出相应的结果。
代表 AI 工具:ChatGPT
、文心一言
、通义千问
、豆包
、Kimi
等。需要说明的是,目前像 GPT 等主流大模型都属于指令型大模型。
在使用指令型 AI 进行对话时,需要给出清晰、具体的指令,并提供结构化的数据或信息,便于模型处理。
使用指令型 AI 工具时,无论是生成文本、图片还是视频,如果你想得到相对准确的答案,核心在于你的指令提示词一定要准确。
指令型 AI 提问技巧,也可以说是 AI 的提问万能公式,通常需遵循四个步骤:
- 角色扮演:我们要给 AI 一个身份,让它站在什么角色、什么身份去回答我们。
- 任务:你需要让 AI 帮你做什么?翻译、分类、回答还是总结,要明确、具体,不要给模糊的指令。
- 完成步骤:你需要让 AI 先做什么,后做什么,最后做什么。
- 输出格式:把 AI 要呈现给你的形式具体准确地描述出来,是生成文字、图片、视频、表格、思维导图还是代码。
指令型模型需要你事无巨细地交代流程,它才能明白怎么做,因此也诞生了很多 prompt 模板,甚至产生了很多提示词工程师。
毫不夸张地说,在推理型模型出现之前,AI 提示词是学习 AI 必须掌握的技能。
2、推理型 AI
推理模型是一种基于数据分析和逻辑推理的 AI 模型,它能够从数据中提取知识,进行自主学习、推理和决策。它侧重于从已知信息中挖掘潜在的规律和关系。
代表 AI 工具:DeepSeek
。
使用 DeepSeek 这类推理模型的 AI 工具非常简单,它抛弃了之前繁琐的提问模板,直接描述清楚你的问题即可。
例如:
可以看到 DeepSeek 添加了很多内心戏,画面感更强,也能体现很多思考推理的细节。
3、总结
指令型大模型和推理型大模型,就像两个员工:
- 一个是需要你事无巨细地安排工作任务,每个步骤都不能落下。(指令型 AI)
- 一个很机灵,只要你说明要求、目的,它就能自己思考怎么做。(推理型 AI)
8、如何正确使用 DeepSeek?
很多人初次体验 DeepSeek 时,发现它有时候答非所问,或者说话太高大上,不够接地气。其实,这只是你的用法不对。这就像看着一群人拿着东风导弹去炸鱼,还嫌水花不够大一样。
1、DeepSeek 提问技巧
当使用推理型模型 DeepSeek R1
时,你只需要直接提出需求即可。但如果你在此基础上稍加优化,效果会更加完美,让回答更加接近你的提问。
如果真的需要一个万能 Prompt 模板,可以尝试使用这个万能的提问公式:背景+需求(你的目标)+约束条件(可选)
。背景信息给的越多,越能让 DeepSeek R1
理解你的需求,帮助你更好地完成任务。
例如: 我是编程小白(交代背景),怎样快速提高我的Java编程能力(提出需求),不考虑英语水平(约束条件)。
更通俗一点,推理型 AI 提示词公式,可以拆分为四个关键要素:
- 我想要做什么?
- 做这个干嘛用?
- 要做到什么效果(具体要求)?
- 但我担心什么?(具体顾虑,可选)
例如: 我要做一个小红书的创业笔记,要给想做副业的人用,希望能让他们快速理解小红书应该如何赚钱,但我担心这些创业小白并不能理解商业的很多专业名词和概念。
总之,在使用 DeepSeek
时,不需要你写“专业提示词”,直接用自然语言清晰地表达出真实场景和具体需求就行了。
2、让 DeepSeek 说人话
在使用DeepSeek时,还有一个好用的技巧,就是让它“说人话”。如果AI的回答过于专业,或者晦涩难懂,因为所有的AI回答,在你没有经过专业知识学习之前,它的回答通常都会有一些抽象和官方,有时候还是不方便普遍人理解。这个时候,你直接跟DeepSeek补充回复:“说人话
”,你会发现它的表达瞬间变得直白易懂。
例如,你向DeepSeek输入:`