url <- "https://finance.yahoo.com/calendar/earnings?from=2022-12-04&to=2022-12-10&day=2022-12-06"
download_table <- function(url) {
url_file <- GET(url)
web_page_parsed <- htmlParse(url_file)
tables <- readHTMLTable(web_page_parsed)
}
url_file <- GET(url)
web_page_parsed <- htmlParse(url_file)
tables <- readHTMLTable(web_page_parsed)
print(head(tables))
我在雅虎用过这个,效果很好。但我试过这个:
url <- "https://www.benzinga.com/calendars/earnings"
download_table <- function(url) {
url_file <- GET(url)
web_page_parsed <- htmlParse(url_file)
tables <- readHTMLTable(web_page_parsed)
}
url_file <- GET(url)
web_page_parsed <- htmlParse(url_file)
tables <- readHTMLTable(web_page_parsed)
print(head(tables))
tables$`NULL`
结果我没有得到任何表格,只有这个:
> print(head(tables))
$`NULL`
Date time ticker Quarter Prior EPS Est EPS Actual EPS EPS Surprise
1 Date time ticker Quarter Prior EPS Est EPS Actual EPS EPS Surprise
Prior Rev Est Rev Actual Rev Rev Surprise Get Alert
1 Prior Rev Est Rev Actual Rev Rev Surprise Get Alert
$`NULL`
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13
1
2 <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
> tables$`NULL`
Date time ticker Quarter Prior EPS Est EPS Actual EPS EPS Surprise
1 Date time ticker Quarter Prior EPS Est EPS Actual EPS EPS Surprise
Prior Rev Est Rev Actual Rev Rev Surprise Get Alert
1 Prior Rev Est Rev Actual Rev Rev Surprise Get Alert
>
如果我在源代码中搜索,例如股票代码,我找不到它们。所以我不能使用rvest包来废弃它们。
有人知道怎么对付binginga吗?
谢谢你和KR
网页搜罗Bezinga收入日历与rvest和httpr
1条答案
按热度按时间xxe27gdn1#
数据是从网络部分(开发人员工具中的inspect元素)中看到的API提取的。
链接如下:
https://api.benzinga.com/api/v2.1/calendar/earnings?token=1c2735820e984715bc4081264135cb90¶meters[date_from]=2023-01-25¶meters[date_to]=2023-01-25¶meters[tickers]=&pagesize=1000
然后,您可以创建一个函数来更改日期并过滤感兴趣的股票代码(
[tickers]
),我在这里编写了一个httr2
函数作为建议,该函数将from_date
和to_date
作为输入。