我使用NextJS和ExpressJS作为服务器。
我已经实现了自定义路由,就像nextjs文档中的示例(https://nextjs.org/docs#custom-routes-using-props-from-url)一样,我还使用getInitialProps进行服务器端呈现。
我还使用了Screaming Frog SEO Spider作为爬虫来测试它是否能够抓取我的动态页面(它不能抓取我的动态页面,它只会抓取静态页面)。我不知道我是否做错了什么,但我只是按照文档的自定义路线。
我真的希望爬虫抓取我的动态网页,因为它会影响我们网站的搜索引擎优化。
谢谢
3条答案
按热度按时间pbpqsu0x1#
有一个常见的SEO建议是不要建立动态网站。我不是NextJS和ExpressJS的Maven。但总的来说,我可以说大多数爬虫都不喜欢动态网站。要抓取动态网站,他们需要执行JavaScript,这需要时间和资源。据我所知,谷歌可以抓取动态网站,请遵循link。所以,这是可能的谷歌爬虫成功地抓取您的网站。2请不要建立搜索引擎优化SPA。3关于尖叫青蛙搜索引擎优化蜘蛛。4据我所知,它也可以使用 chrome 像谷歌爬虫。5请阅读文档。
liwlm1x92#
在我的项目中,我添加了一个
sitemap.xml.tsx
作为页面,它允许GoogleCrawler查看所有可用的页面,为了使其工作,您必须能够检索所有可能的动态页面,然后创建站点Map。我会按照下面给出的例子:https://dev.to/timrichter/dynamic-sitemap-with-next-js-41pe关于如何正确实现网站Map。
cqoc49vn3#
我不知道你是否设法解决了这个问题,但我也遇到过类似的问题,我的方法的问题是,我没有在我的主页上渲染任何路线在构建时间。基本上,当爬虫到达主页,有是不是任何文章可见的因为这javascript是需要的到呈现他们(我有一个功能来渲染或不渲染文章)。SEO爬虫需要链接和路线来导航和Map您的网站:)