目录

🔍 搜索语法与俞军搜索笔记

ℹ️ 学习看板

  • 前置要求:无,零基础可读
  • 预计成本:免费 · ⏱ 30 分钟 · 🧠 中

💬 荣誉归属于原作者

  • 本文内容:参考引用自互联网档案馆(Wayback Machine)存档的网页历史版本,基于原文核心思想进行重新解读与写作

  • 原始来源:中文搜索引擎指南网搜网(sowang.com),存档时间约为 2012 年前后

  • 许可协议:无(原站已关闭,协议不可考)

  • 感谢其对中文互联网搜索文化的贡献。

  • 备注:搜网是中国互联网早期最重要的搜索引擎研究社区之一,现已停止更新,原始内容已无法访问。本文基于原文思想进行了重新解读和写作,非原文照搬。就是想申请授权也不知道找谁。如果有原作前辈看见,请联系作者添加更详细的版权声明,或删除相关内容。

  • 致敬:俞军算是中国产品经理的祖师爷,搜网和相关笔记让无数后辈受益。他总结的方法论,算是中国产品方法论的发轫之作。后辈小子在此叩首。此网站也算是对前辈的致敬。


📖 一、完整搜索语法

基础三件套(任何搜索引擎通用)

双引号 ""(精确匹配) 强制包含完全一致的短语,不会被拆词。 示例:"上海交通大学 生存手册" → 只找包含这整句话的页面

减号 -(排除词) 减号紧跟要排除的词,减号前有空格,后无空格。 示例:苹果 -手机 -iPhone → 搜水果苹果,排除所有数码相关

OR(任意一个) 搜索包含 A 或 B 的结果,OR 必须大写。 示例:提示词工程 OR prompt engineering


进阶指令

site:(站内搜索) 只在特定域名内搜索,冒号后面直接接网址,不加空格。 示例:提示词框架 site:zhihu.com

filetype:(文件格式) 找特定格式的文档。 示例:俞军产品方法论 filetype:pdf 常用格式:pdf / doc / ppt / xls

intitle:(标题限定) 关键词必须出现在网页标题里,过滤掉标题不相关的内容。 示例:intitle:提示词工程 入门

inurl:(网址限定) 关键词出现在网页 URL 中,常用来找特定类型的页面。 示例:inurl:github 提示词模板

*(通配符) 用星号代替记不清的词,让搜索引擎自动补全。 示例:"俞军 * 搜索" → 能找到「俞军谈搜索」「俞军的搜索笔记」等

..(数字区间,Google 专用) 搜索某个数字范围内的内容。 示例:笔记本电脑 3000..5000元 / MacBook 2019..2022


组合使用示例

# 在知乎找关于提示词框架的PDF
提示词框架 site:zhihu.com filetype:pdf

# 找俞军早期关于搜索的文章,排除书籍广告
俞军 搜索 -《俞军产品方法论》 site:weibo.com OR site:douban.com

# 找标题里带"搜索技巧"的文章,只看知乎和少数派
intitle:搜索技巧 site:zhihu.com OR site:sspai.com

哪些引擎还好用,哪些基本废了

语法GoogleBing百度
"" 精确匹配✅ 有效✅ 有效⚠️ 部分有效
- 排除词⚠️ 效果一般
site:
filetype:
intitle:
inurl:
* 通配符⚠️
.. 数字区间

现实情况:这套语法在上古时代(2005-2015年)是顶级网民的核武器。现在的搜索引擎语义理解能力大幅提升,普通搜索的命中率已经很高。但当你需要精准过滤、指定来源、找特定格式时,这些语法依然是最快的路径。


🧠 二、俞军与搜索的「上古遗产」

俞军是谁

俞军是百度的第一位产品经理,2001年加入百度,负责搜索产品。他被认为是中国互联网早期产品经理的精神图腾之一,最出名的一句话是:

「用户不是在输入关键词,而是在表达欲望。」

这句话的意思是:搜索引擎的本质任务,是理解用户真正想要什么,而不只是匹配字面词语。


上古文章在哪里?

俞军早期的文章主要留存在以下几个地方(部分已失效,需要靠互联网档案馆或转载):

① 百度贴吧·搜索爱好者吧 俞军早年在这里非常活跃,发表了大量关于搜索逻辑、用户行为的帖子。这是最早的「俞军语录」来源地。现在直接搜索的话,大多数帖子已经被清理或沉没,但可以尝试:

俞军 搜索 site:tieba.baidu.com

② 搜狐博客(已基本失效) 俞军在搜狐博客有账号,2000年代中期更新频繁。原地址基本已经无法访问,但内容被大量转载留存。搜索:

俞军 搜索 site:sohu.com

③ 互联网档案馆(Wayback Machine) 网址:https://web.archive.org 如果你有原始链接,可以在这里查找历史快照。


俞军关于搜索的核心思想(可确认部分)

以下观点来源于多处转载,基本可信:

关于搜索的本质

  • 搜索引擎是用户需求的满足工具,核心是理解「用户欲望」而非「关键词」
  • 一个好的搜索结果,是在用户没有把需求说清楚的情况下,依然给出正确答案

关于用户行为

  • 用户是懒的,搜索词越短越好;但短词意图越模糊,越难满足
  • 用户输错词不是用户的问题,是搜索引擎的问题

关于搜索质量

  • 搜索结果排序的本质是「对信息价值的判断」,而价值是相对于特定用户的

关于「搜索98条」的说明

⚠️ 存疑标注

网络上流传的「俞军搜索98条」或「俞军搜索笔记」,不同版本的名称和条数出入较大,部分内容真实性存疑(可能混入了他人归纳的内容)。确认度最高的俞军早期思想留存,是他在百度贴吧搜索爱好者吧发表的帖子,以及后来被整理入《俞军产品方法论》(2019年,机械工业出版社)一书的部分。

如果你想找到最原始的版本,建议用这个方法搜索:

"俞军" "搜索" "贴吧" 98 OR 笔记 OR 语录

然后交叉比对多个来源,再判断哪个版本更可信。这本身就是一次信息素养的实战练习。


🚀 下一步

学完本节,继续阅读 搜索引擎底层逻辑:李彦宏与谷歌PageRank——了解搜索引擎是怎么给网页排名的,理解”为什么搜索引擎能找到你要的东西”。