php 我需要从原来的网站提取文章标签的内容,他们的风格,并在我的网站后

bogh5gae  于 2023-04-10  发布在  PHP
关注(0)|答案(1)|浏览(100)

这里有一个url. https://www.finn.no/car/used/search.html?orgId=3553552&sort=PUBLISHED_DESC的例子
在这里,我有advertisemets存储在标签。我需要收集他们每次在我的网站上的页面是geting加载和显示他们给游客也改变一些风格选项,如背景和他们如何在我的网站上出现一般。也有分页选项,所以需要transfet太多。
这个市场提供的唯一选择是iFrame,在2023年的世界里看起来非常糟糕。
原始网站的地址,这将是张贴:https://bbvest.no
我尝试了代码,但没有成功:

<?php
    $url="https://www.finn.no/car/used/search.html?orgId=3553552&sort=PUBLISHED_DESC";
    $html=file_get_contents($url);
        $doc = new DOMDocument();
    $doc->loadHTML($html);
    $div=$doc->getElementsByClassName("ads__unit");
        
        
?>

<div><?php echo $div; ?></div>

谢谢您的帮助。

jpfvwuh4

jpfvwuh41#

类DOMDocument不包含getElementsByClassName方法
为了得到文本和图像,

<?php
$url="https://www.finn.no/car/used/search.html?orgId=3553552&sort=PUBLISHED_DESC";
$html=file_get_contents($url);
$doc = new DOMDocument();
libxml_use_internal_errors(true); // use it if getting error DOMDocument::loadHTML(): Tag finn-topbar invalid in Entity
$doc->loadHTML($html);

$arts = $doc->getElementsByTagName('article'); // get tag article
$display = "";
foreach($arts as $index => $art){
    $imgs = $doc->getElementsByTagName('img'); // get tag img in tag article
    $article = $art->textContent; // text of article
    $display.= $article."</br>";
    $display.= $imgs[$index]->getAttribute('src')."</br>"; // src img in tag img
}
?>

<div><?php echo $display; ?></div>

相关问题