我尝试npb.jp使用R中的rvest包从www.example.com网站中抓取两个表。我尝试使用CSS选择器为2个表,但没有用。问题是否在于网页的格式?
验证码:
html <- read_html("https://npb.jp/bis/eng/2022/stats/std_c.html")
css <- "#stdivmaintbl > table > tbody > tr > td > div:nth-child(1)"
nodes <- html_nodes(html, css)
table <- html_table(nodes)[[1]]
df <- data.frame(table)
代码正在阅读html,但似乎找不到表。
感谢任何帮助。
1条答案
按热度按时间vyswwuz21#
不管什么原因,当我试图直接读取URL时,我得到了一个关于证书的错误,所以我将源html复制并粘贴到一个文件中,而不是使用URL阅读它。我假设我从文件中读取的内容应该仍然与您从互联网上读取的内容相同。这对我来说很有效: