1. DeepSeek 是什么
DeepSeek,是一家在2023年于杭州成立的AI公司「深度求索」开发的大模型名称。DeepSeek 发展情况如下:
2024年1月,发布「DeepSeek LLM」,这是他们正式发布的第一版DeepSeek 大模型。
2024年5月,发布「DeepSeek-V2」,正式打响中国大模型价格战,当时新发布的 DeepSeek-V2 的API价格只有 GPT-4o 的 2.7%,随后一周时间,国产厂商全部跟进,字节、阿里、百度、腾讯全部降价。
2024年12月,发布「DeepSeek-V3」且开源,训练成本仅为557.6万美元,剔除掉Meta、OpenAI等大厂的前期探索成本,大概是别人的三分之一,并且整体模型评测能力媲美闭源模型,震惊海外,自此,东方的神秘力量彻底坐实。
2025年1月,发布全新的推理模型DeepSeek-R1 且开源,效果媲美业界标杆OpenAI o1,同时API价格仅为OpenAI o1的3.7%,再一次震惊海外,让Meta连夜成立四个研究小组,让全球算力暴跌,英伟达的神话都岌岌可危。
接下来,我们就看看火遍全球的DeepSeek-R1 大模型到底应该怎么用。
自然对话优先
无需刻意设计思维链,直接表达需求
目标导向沟通
说明应用场景比提供指令更重要
动态难度调节
通过”说人话”等指令控制输出复杂度
专业深度可选
保留但不依赖传统提示词工程技巧
下文将具体展开每个原则的实践方法。
原理说明
作为专精推理的大模型,DeepSeek-R1内置完整的思考链条。传统提示词工程中的分步指令(如”请按以下步骤分析…”)反而会限制其推理能力的发挥。
对比案例
传统方式:
作为新能源行业分析师,请按以下结构撰写报告:
市场规模(800字)
竞争格局(800字)
技术路线(800字)
要求:引用2024年最新数据…
优化方式:
下周要与比亚迪电池供应商谈判,需要:
用外行能听懂的语言解释他们的技术优势
预测可能的报价区间
提供3个专业谈判术语及使用场景
效果差异:前者产出标准化报告,后者生成包含价格锚定策略的实战指南。
操作公式
[身份背景] + [使用场景] + [核心目标] + [特别关注点]
应用示例
基础版:”我要给高中生讲解量子力学,需要三个生活化比喻”
进阶版:”作为医疗器械销售,需要准备与三甲医院主任的会谈资料,重点突出我们的耗材在手术室场景下的感染防控优势”
当遇到晦涩难懂的回复时,可通过以下方式优化:
即时修正
在回答后追加“请用更通俗的方式解释”
预设条件
“假设听众是初中文化水平,请重新说明”
渐进升级
“现在补充技术细节(适合工程师级别)”
新手用户
直接以日常对话方式提问
进阶用户
尝试目标场景描述公式
专业用户
结合传统prompt技巧进行深度定制
DeepSeek-R1的技术突破,本质上是对AI服务本质的回归——当大模型足够理解人类意图时,我们不再需要学习”与机器对话的特殊语言”。这种转变正如智能手机取代命令行:技术进化的终极目标,是让复杂消失于无形。