scrapy TakeFirst()在scrappy中取所有数据

2ul0zpep  于 2022-11-09  发布在  其他
关注(0)|答案(1)|浏览(192)

我真的是初学者,有这个代码:

class ActivityItem(scrapy.Item):
Id = scrapy.Field(
output_processor=TakeFirst()
)
EconomicActivityDescription = scrapy.Field(
output_processor=TakeFirst()
)

我该怎么办,当想把ActivityItem全部报废时,不仅第一个不为null?

output_processor=TakeFirst()
h43kikqp

h43kikqp1#

您可以使用文档中所述的任何内置处理器。
如果要返回由给定分隔符联接的所有项,可以使用Join;如果要返回所有项的列表形式的值,则可以使用Identity
1.使用Join

from itemloaders.processors import Join
class ActivityItem(scrapy.Item):
  Id = scrapy.Field(output_processor=Join(","))
  EconomicActivityDescription = scrapy.Field(output_processor=Join(","))

1.使用Identity

from itemloaders.processors import Identity
class ActivityItem(scrapy.Item):
  Id = scrapy.Field(output_processor=Identity())
  EconomicActivityDescription = scrapy.Field(output_processor=Identity())

相关问题