php simple_html_dom抓取所有带有字符的行,然后将它们输出到下面

vlju58qv  于 2023-01-24  发布在  PHP
关注(0)|答案(1)|浏览(115)

目前我已经在使用HTMLDOM进行抓取方面走到了这一步(就示例而言)

<?php
require 'simple_html_dom.php';
$html = file_get_html('https://nitter.absturztau.be/chillartaholic');
$title = $html->find('title', 0);
$image = $html->find('img', 0);
echo $title->plaintext."<br>\n";
echo $image->src;
?>

然而,我不想检索标题和图片,而是想获取目标页面中以以下内容开始的所有行:

〈a class=“推特链接”

并显示刮除的线-在他们的整体-从上到下。
(第一条划线为:

> <a class="tweet-link"
> href="/ChillArtaholic/status/1413973360841744390#m"></a>

这在htmldom中有可能吗(或者对可抓取的行数等有限制吗?)

f87krz0w

f87krz0w1#

奇怪的是,昨天的答案不见了。
这是有效的共识(尽管他们的答案有许多不同的其他方法):/

<?php
$dom = new DOMDocument;
@$dom->loadHTML($html);
$links = $dom->getElementsByTagName('a');
$url = 'https://nitter.absturztau.be/chillartaholic';
$html = file_get_contents($url);
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$nodes = $xpath->query('//a[@class="tweet-link"]');

foreach ($nodes as $node){
    echo $link->nodeValue;
    echo $node-> getAttribute('href'), '<br>';
}
?>

相关问题