目录
🔍 搜索语法与俞军搜索笔记
ℹ️ 学习看板
- 前置要求:无,零基础可读
- 预计成本:免费 · ⏱ 30 分钟 · 🧠 中
💬 荣誉归属于原作者
本文内容:参考引用自互联网档案馆(Wayback Machine)存档的网页历史版本,基于原文核心思想进行重新解读与写作
原始来源:中文搜索引擎指南网搜网(sowang.com),存档时间约为 2012 年前后
许可协议:无(原站已关闭,协议不可考)
感谢其对中文互联网搜索文化的贡献。
备注:搜网是中国互联网早期最重要的搜索引擎研究社区之一,现已停止更新,原始内容已无法访问。本文基于原文思想进行了重新解读和写作,非原文照搬。就是想申请授权也不知道找谁。如果有原作前辈看见,请联系作者添加更详细的版权声明,或删除相关内容。
致敬:俞军算是中国产品经理的祖师爷,搜网和相关笔记让无数后辈受益。他总结的方法论,算是中国产品方法论的发轫之作。后辈小子在此叩首。此网站也算是对前辈的致敬。
📖 一、完整搜索语法
基础三件套(任何搜索引擎通用)
双引号 ""(精确匹配)
强制包含完全一致的短语,不会被拆词。
示例:"上海交通大学 生存手册" → 只找包含这整句话的页面
减号 -(排除词)
减号紧跟要排除的词,减号前有空格,后无空格。
示例:苹果 -手机 -iPhone → 搜水果苹果,排除所有数码相关
OR(任意一个)
搜索包含 A 或 B 的结果,OR 必须大写。
示例:提示词工程 OR prompt engineering
进阶指令
site:(站内搜索)
只在特定域名内搜索,冒号后面直接接网址,不加空格。
示例:提示词框架 site:zhihu.com
filetype:(文件格式)
找特定格式的文档。
示例:俞军产品方法论 filetype:pdf
常用格式:pdf / doc / ppt / xls
intitle:(标题限定)
关键词必须出现在网页标题里,过滤掉标题不相关的内容。
示例:intitle:提示词工程 入门
inurl:(网址限定)
关键词出现在网页 URL 中,常用来找特定类型的页面。
示例:inurl:github 提示词模板
*(通配符)
用星号代替记不清的词,让搜索引擎自动补全。
示例:"俞军 * 搜索" → 能找到「俞军谈搜索」「俞军的搜索笔记」等
..(数字区间,Google 专用)
搜索某个数字范围内的内容。
示例:笔记本电脑 3000..5000元 / MacBook 2019..2022
组合使用示例
# 在知乎找关于提示词框架的PDF
提示词框架 site:zhihu.com filetype:pdf
# 找俞军早期关于搜索的文章,排除书籍广告
俞军 搜索 -《俞军产品方法论》 site:weibo.com OR site:douban.com
# 找标题里带"搜索技巧"的文章,只看知乎和少数派
intitle:搜索技巧 site:zhihu.com OR site:sspai.com
哪些引擎还好用,哪些基本废了
| 语法 | Bing | 百度 | |
|---|---|---|---|
"" 精确匹配 | ✅ 有效 | ✅ 有效 | ⚠️ 部分有效 |
- 排除词 | ✅ | ✅ | ⚠️ 效果一般 |
site: | ✅ | ✅ | ✅ |
filetype: | ✅ | ✅ | ✅ |
intitle: | ✅ | ✅ | ✅ |
inurl: | ✅ | ✅ | ✅ |
* 通配符 | ✅ | ⚠️ | ✗ |
.. 数字区间 | ✅ | ✗ | ✗ |
现实情况:这套语法在上古时代(2005-2015年)是顶级网民的核武器。现在的搜索引擎语义理解能力大幅提升,普通搜索的命中率已经很高。但当你需要精准过滤、指定来源、找特定格式时,这些语法依然是最快的路径。
🧠 二、俞军与搜索的「上古遗产」
俞军是谁
俞军是百度的第一位产品经理,2001年加入百度,负责搜索产品。他被认为是中国互联网早期产品经理的精神图腾之一,最出名的一句话是:
「用户不是在输入关键词,而是在表达欲望。」
这句话的意思是:搜索引擎的本质任务,是理解用户真正想要什么,而不只是匹配字面词语。
上古文章在哪里?
俞军早期的文章主要留存在以下几个地方(部分已失效,需要靠互联网档案馆或转载):
① 百度贴吧·搜索爱好者吧 俞军早年在这里非常活跃,发表了大量关于搜索逻辑、用户行为的帖子。这是最早的「俞军语录」来源地。现在直接搜索的话,大多数帖子已经被清理或沉没,但可以尝试:
俞军 搜索 site:tieba.baidu.com
② 搜狐博客(已基本失效) 俞军在搜狐博客有账号,2000年代中期更新频繁。原地址基本已经无法访问,但内容被大量转载留存。搜索:
俞军 搜索 site:sohu.com
③ 互联网档案馆(Wayback Machine) 网址:https://web.archive.org 如果你有原始链接,可以在这里查找历史快照。
俞军关于搜索的核心思想(可确认部分)
以下观点来源于多处转载,基本可信:
关于搜索的本质
- 搜索引擎是用户需求的满足工具,核心是理解「用户欲望」而非「关键词」
- 一个好的搜索结果,是在用户没有把需求说清楚的情况下,依然给出正确答案
关于用户行为
- 用户是懒的,搜索词越短越好;但短词意图越模糊,越难满足
- 用户输错词不是用户的问题,是搜索引擎的问题
关于搜索质量
- 搜索结果排序的本质是「对信息价值的判断」,而价值是相对于特定用户的
关于「搜索98条」的说明
⚠️ 存疑标注
网络上流传的「俞军搜索98条」或「俞军搜索笔记」,不同版本的名称和条数出入较大,部分内容真实性存疑(可能混入了他人归纳的内容)。确认度最高的俞军早期思想留存,是他在百度贴吧搜索爱好者吧发表的帖子,以及后来被整理入《俞军产品方法论》(2019年,机械工业出版社)一书的部分。
如果你想找到最原始的版本,建议用这个方法搜索:
"俞军" "搜索" "贴吧" 98 OR 笔记 OR 语录然后交叉比对多个来源,再判断哪个版本更可信。这本身就是一次信息素养的实战练习。
🚀 下一步
学完本节,继续阅读 搜索引擎底层逻辑:李彦宏与谷歌PageRank——了解搜索引擎是怎么给网页排名的,理解”为什么搜索引擎能找到你要的东西”。