获取下一个同级节点值/文本返回空字符串

3duebb1j 于 2021-10-10 发布在 Java

关注(0)|答案(0)|浏览(266)

我试图从某个url获取数据，该url包含大量 h3 每个标签后面都有一个 p 标签。。。。我想循环抛出h3标记，打印每一个标记，跳转到下一个元素（p）并打印它。。。。基本上我想打印 h3=>p 对

$doc = new \DOMDocument('1.0', 'UTF-8');
    $prologue = '<?xml encoding="UTF-8">';

    $doc->loadHTML($prologue.$page);
    $finder = new \DOMXPath($doc);
    $nodes = $finder->query("//*[contains(@class, 'td-post-content td-pb-padding-side')]");
    $hList =  $nodes[0]->getElementsByTagName('h3');

        foreach ($hList as $k=>$h )
        {
            $text = $h->nodeValue ;
            dump( 'h3->' , $text);
            $p = $h->nextSibling ;
            dump( 'p->' , $p->nodeValue);
        }

下面是一个示例链接
https://unludetay.com/2020/01/timothee-chalamet-kac-kilo-boyu-kac-nereli-kac-yasinda-sevgilisi-kimdir.html
这是我的输出

正如您所看到的，由于某些原因，p标记是一个空字符串，但是在源代码中您可以看到下一个元素（p）及其值/文本