下面是html片段
<P class="subtitulo">
<b>
<a name="Editores"> Editorial </a>
"assistant"
</b>
</p>
通过使用这个零碎的代码
response.css("p.subtitulo *::text").extract()
我得到
['编辑','助理']
response.css("p.subtitulo *::text").get()
我得到的只有“
助理
“我想要完整的字符串,不带任何逗号,如
“编辑助理”
使用Beautiful soup我得到的文本没有逗号。但是如何用Scrapy做到这一点。因为我有其他用逗号分隔的角色,所以我不想使用split()。
这是页面url http://www.scielo.org.co/revistas/zop/iedboard.htm
1条答案
按热度按时间rta7y2nd1#
您可以通过调用
.join()
和.getall()
方法来执行此操作,如下所示:输出: