R语言 获取{xml_nodeset(0)},即使CSS选择器识别节点

dauxcl2d  于 2023-04-03  发布在  其他
关注(0)|答案(1)|浏览(95)

我试图从here,表中抓取数据,特别是姓名,长度,身高和翼展。使用SelectorGadget,它说姓名包含在.text-left a节点中,并说有411个对象(考虑到表包含411个球员,这似乎是正确的)。
然而,当运行下面的代码时,我得到一个空列表。

library(rvest)
library(polite)
library(tidyverse)

crafted <- read_html("https://craftednba.com/player-traits/length")

names <- crafted %>% 
  html_nodes(".text-left a") %>% 
  html_text()

我发现这篇文章的另一个人似乎有一个类似的问题和顶部的答案说,不要使用SelectorGadget.按照他们的指示,我仍然没有得到任何与以下代码:
x一个一个一个一个x一个一个二个x
任何帮助都将不胜感激。

pbpqsu0x

pbpqsu0x1#

以下是如何自动化浏览器来拉取表格:

# load libraries
library(RSelenium)
library(rvest)
library(magrittr)

# define target url
crafted_url <- "https://craftednba.com/player-traits/length"

# start RSelenium ------------------------------------------------------------

rD <- rsDriver(browser="firefox", port=4550L, chromever = NULL)
remDr <- rD[["client"]]

# Navigate to webpage -----------------------------------------------------
remDr$navigate(crafted_url)

# pull the webpage html
# then read it
page_html <- remDr$getPageSource()[[1]] %>% 
              read_html()

# search for <table> node on the page's html
tables <- page_html  %>%   html_table() 

# print the first (and only table)
tables[[1]]

相关问题