我们正在进行一个从erp系统中收集数据并存储在数据库中的项目,我们研究了大量的大数据技术,得出了使用apache-kafka来完成任务的结论,因为kafka是实时摄取数据的。
这个问题经过研究,我们还不知道该怎么办。我们能够创建一个管道来从一个file.txt文件收集数据,但是当涉及到ERP时,使用他们的API。
有人能指引我们吗?或者谁能给我们提供一个课程,我们可以买或看,可以帮助我们?谢谢
我们正在进行一个从erp系统中收集数据并存储在数据库中的项目,我们研究了大量的大数据技术,得出了使用apache-kafka来完成任务的结论,因为kafka是实时摄取数据的。
这个问题经过研究,我们还不知道该怎么办。我们能够创建一个管道来从一个file.txt文件收集数据,但是当涉及到ERP时,使用他们的API。
有人能指引我们吗?或者谁能给我们提供一个课程,我们可以买或看,可以帮助我们?谢谢
1条答案
按热度按时间3j86kqsm1#
为了记录在案(因为我想你已经找到了解决办法)。一条值得探索的道路是使用Kafka连接。毕竟,这就是创建api的原因。
我将尝试创建/编写自定义连接器,以从所需的ERP中提取数据并将其提供给kafka集群:
或者直接从erp的数据库,如果可以授予这样的访问权限
或者通过尝试调用各种rest服务/端点,erp可能会公开
或者erp已经发布事件以暴露状态变化等。