网站没流量?先看看你交“站点地图”这份作业了没!
- 网站没流量?先看看你交“站点地图”这份作业了没!
- 我的网站上线仨月,百度连个招呼都不打
- sitemap 到底是个啥?别被名字吓到,它就是你网站的“目录小抄”
- 搜索引擎眼里的世界:没 sitemap 就像进迷宫没地图
- 哪些网站压根不用操心 sitemap?静态博客党偷着乐吧
- 电商站、内容平台、新闻门户——你们不交 sitemap 真的会吃亏
- 手动生成 vs 自动生成:别再手动敲 XML 了,那不是勤快是自虐
- 主流框架怎么搞 sitemap?Next.js、Nuxt、WordPress 都有现成外挂
- 1) Next.js(React 党看过来)
- 2) Nuxt3(Vue 党别哭)
- 3) WordPress(PHP 不死)
- 提交就完事了?小心这些坑:路径不对、更新不及时、格式翻车
- sitemap 提交后没效果?别急着骂百度,先查这 5 个地方
- 开发时顺手加个 sitemap 生成器,老板以为你加班干了大事
- sitemap 还能玩出花?搭配 lastmod 和 changefreq 让爬虫更爱你
- robots.txt 里藏 sitemap 地址,老 SEO 人都这么干
- 动态内容网站注意:别把 404 页面也塞进 sitemap 里了
- sitemap 太大怎么办?拆!Google 说单个别超 5 万条
- 本地测试 sitemap 有没有用?curl 一下 + 在线验证工具走起
- sitemap 不是万能药,但没它你可能连入场券都没有
网站没流量?先看看你交“站点地图”这份作业了没!
友情提示:本文 5000+ 字,代码量管饱,阅读时建议左手奶茶右手小饼干,防止低血糖。
我的网站上线仨月,百度连个招呼都不打
先给你讲个真事,前阵子我一发小阿豪,吭哧吭哧用 Next.js 撸了个卖手办的商城,上线 90 天,日 UV 稳定在 5 个——其中 3 个是他自己,另外 2 个是爬虫 404 报错。
阿豪哭着找我:“哥,我 SEO 做得比前女友还认真,咋就没人来?”
我扫了一眼根目录,好家伙,连根sitemap.xml毛都没有。
这就好比开了家网红奶茶店,菜单印好了,原料堆满了,结果门口没挂招牌——外卖小哥想进来都找不到门,你还指望排队打卡?
搜索引擎同理:不递sitemap,它就得靠“盲猜”爬完整站,猜错一步就漏页面,漏得多了,流量自然凉凉。
所以,今天咱们把“作业”补交到位,手把手从 0 到 1,再送你到 100,让爬虫乖乖把你家网站当 VIP 通道走。
sitemap 到底是个啥?别被名字吓到,它就是你网站的“目录小抄”
官方定义背一遍:
sitemap(站点地图)是一个 XML 文件,把站内所有 URL 按标准格式列个清单,顺带告诉搜索引擎“这页面啥时候改的、改得多勤快、在我家心里排第几”。
人话翻译:
它就是给百度、Google 准备的“外卖订单”,你列清楚门牌号、口味偏好、送达时间,外卖小哥(爬虫)不用绕路,直接取餐。
没有订单?那人家只能满大街吆喝“谁家卖饭啊?”——效率低不说,还容易错过你这单。
搜索引擎眼里的世界:没 sitemap 就像进迷宫没地图
爬虫的工作流程简单粗暴:
- 拿到一个种子 URL(通常是首页)
- 下载页面 → 解析 HTML → 提取所有
<a href=""> - 递归往下爬,直到没新链接
- 把爬过的页面丢进索引库
听着挺美好,但现实骨感:
- 你的“新品上架”页面藏在
/product/detail?id=1987,首页没链,分类页也没链,爬虫永远找不到 - 翻页靠 JS 渲染,爬虫一看“空白”,直接放弃
- 网站树状层级 6 层深,爬虫爬着爬着超时走人
给一张“迷宫地图”(sitemap),它就能直奔主题,不绕弯路。
地图里还能标注:
lastmod——我昨天刚更新,快来changefreq——我周更,别天天来白跑priority——这是我亲儿子首页,优先看
哪些网站压根不用操心 sitemap?静态博客党偷着乐吧
先别慌,不是所有人都得交作业。
如果你的站点同时满足下面三条,可以把鼠标移开:
- 页面总数 < 500
- 内链极度健全,任何页面最多 3 次点击能回到首页
- 纯静态 HTML,没用 JS 动态路由
典型代表:GitHub Pages 搭的 Hexo/Jekyll 博客,主题自带/archives、/tags、/categories,把文章列得明明白白,爬虫顺着就扒完了。
但注意:一旦上了“搜索分页”、“无限滚动”、“条件筛选”,就别装死,乖乖生成地图。
电商站、内容平台、新闻门户——你们不交 sitemap 真的会吃亏
来,对号入座:
- SKU 动不动上万,分页 1 2 3 … 99+
- 每天上新 200 篇资讯,旧文章沉到第 18 页
- 活动页 URL 带 6 个 query,隔天就失效
这种体量,靠爬虫“随缘”?怕是想吃屁。
实测数据:某中型电商补交 sitemap 后,百度索引量从 1.2w 飙到 8.4w,自然流量翻 3 倍,真·一篇地图抵十篇软广。
手动生成 vs 自动生成:别再手动敲 XML 了,那不是勤快是自虐
早期我见过的狠人,用 Excel 拖出一万行 URL,再复制到 VSCode 手动补标签,折腾 3 小时,结果百度提示“格式错误”,当场社死。
现在 2026 年了,除非你想练打字,否则一律自动生成。
思路就两条:
- 构建时生成——适合静态站点,打包阶段一次性产出
- 运行时生成——适合动态内容,访问
/sitemap.xml实时查库
下面给你主流方案喂到嘴边。
主流框架怎么搞 sitemap?Next.js、Nuxt、WordPress 都有现成外挂
1) Next.js(React 党看过来)
next@13+ 推荐用next-sitemap,两步搞定:
npmi next-sitemap -D根目录新建next-sitemap.config.js:
/** @type {import('next-sitemap').IConfig} */module.exports={siteUrl:'https://shouban.com',// 你的域名generateRobotsTxt:true,// 顺带生成 robots.txtchangefreq:'daily',priority:0.7,sitemapSize:5000,// 单文件最多 5k 条,多出的自动拆分// 动态路由补刀additionalPaths:async()=>{// 假设商品详情页从数据库捞constproducts=awaitfetch('https://api.shouban.com/products').then(r=>r.json())returnproducts.map(p=>({loc:`https://shouban.com/product/${p.id}`,lastmod:p.updatedAt,priority:0.8}))}}package.json 加脚本:
"postbuild":"next-sitemap"vercel 一键部署,打包完自动在public/下吐出:
sitemap-0.xmlsitemap-1.xmlrobots.txt
搜索引擎来敲门,直接放行。
2) Nuxt3(Vue 党别哭)
装模块:
npmi @nuxtjs/sitemapnuxt.config.ts加一行:
exportdefaultdefineNuxtConfig({modules:['@nuxtjs/sitemap'],sitemap:{hostname:'https://shouban.com',gzip:true,routes:async()=>{const{data}=await$fetch('https://api.shouban.com/products')returndata.map((p:any)=>`/product/${p.id}`)}}})build 完dist/里同样躺好sitemap.xml。
3) WordPress(PHP 不死)
插件市场搜 “Yoast SEO”,百万级安装,启用后:
SEO → 通用 → 功能 → 打开 XML 站点地图,保存即可。
想自定义?在主题functions.php扔钩子:
add_filter('wpseo_sitemap_entry',function($url,$type,$post){if($type==='post'&&$post->post_type==='product'){$url['priority']=0.9;// 商品页给高优}return$url;},10,3);提交就完事了?小心这些坑:路径不对、更新不及时、格式翻车
生成了不交等于白给,提交姿势不对同样社死。
常见死法:
- 把
sitemap.xml扔在/src下,结果build 没复制到public,搜索引擎 404 - 本地测试用
http://localhost:3000/sitemap.xml,上线忘记改域名,全链 localhost - 万年不更新,
lastmod停留在 2023,爬虫一来发现“旧货”,降低抓取频次 - 手写时标签大小写写错,
<UrlSet>直接被判非法
正确流程:
- 确保地图托管在根目录可访问:
https://shouban.com/sitemap.xml - robots.txt 里加一句:
老 SEO 人都这么干,爬虫进门先瞄一眼。Sitemap: https://shouban.com/sitemap.xml - 百度资源平台 → 普通收录 → 提交 sitemap 地址
Google Search Console → 索引 → 站点地图 → 添加 - 每次上线新内容,自动触发
postbuild重新生成,保证lastmod新鲜
sitemap 提交后没效果?别急着骂百度,先查这 5 个地方
看状态码:curl 一下
curl-I https://shouban.com/sitemap.xml返回 200 再谈别的,301、404 赶紧修。
看大小:单文件超过 50MB 或 5 万条,Google 直接拒收。
解决:拆!next-sitemap会自动拆sitemap-0,1,2…,再搞个sitemap-index.xml当目录。看内容:别把 404、302、noindex 页面塞进去,自曝其短。
看时间:
lastmod必须 W3C 格式,最好带时区2026-01-17T14:08:32+08:00,别写“昨天”。看配额:百度每天免费额度 10 条 sitemap 更新,大站记得分批推送,别一次性刷爆。
开发时顺手加个 sitemap 生成器,老板以为你加班干了大事
讲个职场小技巧:
需求评审时,产品说“这周 SEO 要优化”,你默默把next-sitemap装上,打包后把自动生成的地图甩给他,再附一张 Search Console 索引量上涨的截图。
老板拍肩膀:“不错,加班到几点?”
你微笑:“也就 5 分钟。”
sitemap 还能玩出花?搭配 lastmod 和 changefreq 让爬虫更爱你
进阶玩法:动态计算优先级。
商品页:库存 > 100 且 评价 > 4.8,priority 给 1.0;库存 0,直接 0.3,告诉搜索引擎“别来了,来了也白来”。
资讯页:发布时间 < 1 天,changefreq = hourly;> 1 年,直接 never,节省抓取预算。
代码示例(Node 端):
functioncalcPriority(product){if(product.stock===0)return0.3if(product.rating>=4.8&&product.stock>100)return1.0return0.7}functioncalcChangefreq(postDate){constage=Date.now()-newDate(postDate).getTime()constdays=age/(1000*60*60*24)if(days<1)return'hourly'if(days<7)return'daily'if(days<30)return'weekly'return'monthly'}robots.txt 里藏 sitemap 地址,老 SEO 人都这么干
一行代码的事,别偷懒:
User-agent: * Allow: / Sitemap: https://shouban.com/sitemap.xml爬虫进门先捡地图,礼貌又高效。
动态内容网站注意:别把 404 页面也塞进 sitemap 里了
很多兄弟用getStaticPathsfallback 全站,结果商品下架后数据库标记isDeleted=true,但生成逻辑没过滤,把 404 也写进地图。
搜索引擎一来:你耍我?直接降信任分。
过滤条件写清楚:
constproducts=awaitdb.product.findMany({where:{isOnSale:true,isDeleted:false},select:{id:true,updatedAt:true}})sitemap 太大怎么办?拆!Google 说单个别超 5 万条
拆分思路:
- 按业务模块:
/product-*.xml、/news-*.xml、/tag-*.xml - 按日期:
/sitemap-2026-01.xml
拆完记得在sitemap-index.xml里列子文件:
<sitemapindexxmlns="http://www.sitemaps.org/schemas/sitemap/0.9"><sitemap><loc>https://shouban.com/sitemap-product-0.xml</loc><lastmod>2026-01-17T14:08:32+08:00</lastmod></sitemap><sitemap><loc>https://shouban.com/sitemap-news-0.xml</loc><lastmod>2026-01-17T12:00:00+08:00</lastmod></sitemap></sitemapindex>本地测试 sitemap 有没有用?curl 一下 + 在线验证工具走起
本地启服务:
npmrun devcurlhttp://localhost:3000/sitemap.xml|head线上验证:
Google 官方工具 → https://www.google.com/webmasters/tools/sitemap-list
百度 → https://ziyuan.baidu.com/sitemap/index
上传即秒回错误行号,比女朋友翻旧账还快。
sitemap 不是万能药,但没它你可能连入场券都没有
收个尾:
sitemap 不会直接让你排第一,它只是告诉搜索引擎“hi,我在这儿,内容新鲜,快来”。
可如果连这声招呼都不打,爬虫连你家门朝哪开都不知道,还谈什么收录、排名、流量?
所以,别再学阿豪裸奔,今天就把next-sitemap装上,打包、提交、验证,一条龙 10 分钟搞定。
老板问起来,你就说:“给网站加了张爬虫 VIP 通行证,顺便提升了 300% 索引量。”
他肯定回你:“今晚加餐,鸡腿给你留最大的!”
完,散会,去交作业吧。
欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
推荐:DTcode7的博客首页。
一个做过前端开发的产品经理,经历过睿智产品的折磨导致脱发之后,励志要翻身农奴把歌唱,一边打入敌人内部一边持续提升自己,为我们广大开发同胞谋福祉,坚决抵制睿智产品折磨我们码农兄弟!
| 专栏系列(点击解锁) | 学习路线(点击解锁) | 知识定位 |
|---|---|---|
| 《微信小程序相关博客》 | 持续更新中~ | 结合微信官方原生框架、uniapp等小程序框架,记录请求、封装、tabbar、UI组件的学习记录和使用技巧等 |
| 《AIGC相关博客》 | 持续更新中~ | AIGC、AI生产力工具的介绍,例如stable diffusion这种的AI绘画工具安装、使用、技巧等总结 |
| 《HTML网站开发相关》 | 《前端基础入门三大核心之html相关博客》 | 前端基础入门三大核心之html板块的内容,入坑前端或者辅助学习的必看知识 |
| 《前端基础入门三大核心之JS相关博客》 | 前端JS是JavaScript语言在网页开发中的应用,负责实现交互效果和动态内容。它与HTML和CSS并称前端三剑客,共同构建用户界面。 通过操作DOM元素、响应事件、发起网络请求等,JS使页面能够响应用户行为,实现数据动态展示和页面流畅跳转,是现代Web开发的核心 | |
| 《前端基础入门三大核心之CSS相关博客》 | 介绍前端开发中遇到的CSS疑问和各种奇妙的CSS语法,同时收集精美的CSS效果代码,用来丰富你的web网页 | |
| 《canvas绘图相关博客》 | Canvas是HTML5中用于绘制图形的元素,通过JavaScript及其提供的绘图API,开发者可以在网页上绘制出各种复杂的图形、动画和图像效果。Canvas提供了高度的灵活性和控制力,使得前端绘图技术更加丰富和多样化 | |
| 《Vue实战相关博客》 | 持续更新中~ | 详细总结了常用UI库elementUI的使用技巧以及Vue的学习之旅 |
| 《python相关博客》 | 持续更新中~ | Python,简洁易学的编程语言,强大到足以应对各种应用场景,是编程新手的理想选择,也是专业人士的得力工具 |
| 《sql数据库相关博客》 | 持续更新中~ | SQL数据库:高效管理数据的利器,学会SQL,轻松驾驭结构化数据,解锁数据分析与挖掘的无限可能 |
| 《算法系列相关博客》 | 持续更新中~ | 算法与数据结构学习总结,通过JS来编写处理复杂有趣的算法问题,提升你的技术思维 |
| 《IT信息技术相关博客》 | 持续更新中~ | 作为信息化人员所需要掌握的底层技术,涉及软件开发、网络建设、系统维护等领域的知识 |
| 《信息化人员基础技能知识相关博客》 | 无论你是开发、产品、实施、经理,只要是从事信息化相关行业的人员,都应该掌握这些信息化的基础知识,可以不精通但是一定要了解,避免日常工作中贻笑大方 | |
| 《信息化技能面试宝典相关博客》 | 涉及信息化相关工作基础知识和面试技巧,提升自我能力与面试通过率,扩展知识面 | |
| 《前端开发习惯与小技巧相关博客》 | 持续更新中~ | 罗列常用的开发工具使用技巧,如 Vscode快捷键操作、Git、CMD、游览器控制台等 |
| 《photoshop相关博客》 | 持续更新中~ | 基础的PS学习记录,含括PPI与DPI、物理像素dp、逻辑像素dip、矢量图和位图以及帧动画等的学习总结 |
| 日常开发&办公&生产【实用工具】分享相关博客》 | 持续更新中~ | 分享介绍各种开发中、工作中、个人生产以及学习上的工具,丰富阅历,给大家提供处理事情的更多角度,学习了解更多的便利工具,如Fiddler抓包、办公快捷键、虚拟机VMware等工具 |
吾辈才疏学浅,摹写之作,恐有瑕疵。望诸君海涵赐教。望轻喷,嘤嘤嘤
非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。愿斯文对汝有所裨益,纵其简陋未及渊博,亦足以略尽绵薄之力。倘若尚存阙漏,敬请不吝斧正,俾便精进!