php simple_html_dom抓取所有带有字符的行，然后将它们输出到下面

vlju58qv 于 2023-01-24 发布在 PHP

关注(0)|答案(1)|浏览(115)

目前我已经在使用HTMLDOM进行抓取方面走到了这一步（就示例而言）

<?php
require 'simple_html_dom.php';
$html = file_get_html('https://nitter.absturztau.be/chillartaholic');
$title = $html->find('title', 0);
$image = $html->find('img', 0);
echo $title->plaintext."<br>\n";
echo $image->src;
?>

然而，我不想检索标题和图片，而是想获取目标页面中以以下内容开始的所有行：

〈a class=“推特链接”

并显示刮除的线-在他们的整体-从上到下。
（第一条划线为：

> <a class="tweet-link"
> href="/ChillArtaholic/status/1413973360841744390#m"></a>

这在htmldom中有可能吗（或者对可抓取的行数等有限制吗？）

php

来源：https://stackoverflow.com/questions/75197766/simple-html-dom-scrape-all-lines-with-chracteristic-and-then-output-them-below

1条答案

按热度按时间

f87krz0w1#

奇怪的是，昨天的答案不见了。
这是有效的共识（尽管他们的答案有许多不同的其他方法）：/

<?php
$dom = new DOMDocument;
@$dom->loadHTML($html);
$links = $dom->getElementsByTagName('a');
$url = 'https://nitter.absturztau.be/chillartaholic';
$html = file_get_contents($url);
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$nodes = $xpath->query('//a[@class="tweet-link"]');

foreach ($nodes as $node){
    echo $link->nodeValue;
    echo $node-> getAttribute('href'), '<br>';
}
?>

赞(0）回复(0）举报 2023-01-24

我来回答

php simple_html_dom抓取所有带有字符的行，然后将它们输出到下面

1条答案

相关问题

热门标签

最新问答