我试图从某个url获取数据,该url包含大量 h3
每个标签后面都有一个 p
标签。。。。我想循环抛出h3标记,打印每一个标记,跳转到下一个元素(p)并打印它。。。。基本上我想打印 h3=>p
对
$doc = new \DOMDocument('1.0', 'UTF-8');
$prologue = '<?xml encoding="UTF-8">';
$doc->loadHTML($prologue.$page);
$finder = new \DOMXPath($doc);
$nodes = $finder->query("//*[contains(@class, 'td-post-content td-pb-padding-side')]");
$hList = $nodes[0]->getElementsByTagName('h3');
foreach ($hList as $k=>$h )
{
$text = $h->nodeValue ;
dump( 'h3->' , $text);
$p = $h->nextSibling ;
dump( 'p->' , $p->nodeValue);
}
下面是一个示例链接
https://unludetay.com/2020/01/timothee-chalamet-kac-kilo-boyu-kac-nereli-kac-yasinda-sevgilisi-kimdir.html
这是我的输出
正如您所看到的,由于某些原因,p标记是一个空字符串,但是在源代码中您可以看到下一个元素(p)及其值/文本
暂无答案!
目前还没有任何答案,快来回答吧!