目前我已经在使用HTMLDOM进行抓取方面走到了这一步(就示例而言)
<?php
require 'simple_html_dom.php';
$html = file_get_html('https://nitter.absturztau.be/chillartaholic');
$title = $html->find('title', 0);
$image = $html->find('img', 0);
echo $title->plaintext."<br>\n";
echo $image->src;
?>
然而,我不想检索标题和图片,而是想获取目标页面中以以下内容开始的所有行:
〈a class=“推特链接”
并显示刮除的线-在他们的整体-从上到下。
(第一条划线为:
> <a class="tweet-link"
> href="/ChillArtaholic/status/1413973360841744390#m"></a>
这在htmldom中有可能吗(或者对可抓取的行数等有限制吗?)
1条答案
按热度按时间f87krz0w1#
奇怪的是,昨天的答案不见了。
这是有效的共识(尽管他们的答案有许多不同的其他方法):/