我有csv文件在S3桶,我想用这些来训练模型在sagemaker。
使用此代码,但它给出错误(文件未找到)
import boto3
import pandas as pd
region = boto3.Session().region_name
train_data_location = 's3://taggingu-{}/train.csv'.format(region)
df=pd.read_csv(train_data_location, header = None)
print df.head
解决这个问题的办法是什么?
2条答案
按热度按时间pbpqsu0x1#
不确定,但此堆栈溢出是否可以解决此问题?Load S3 Data into AWS SageMaker Notebook
引用@Chhoser的话:
gudnpqoy2#
您可以使用AWS SDK for Pandas,这是一个扩展Pandas的库,可以与AWS数据存储顺畅地工作。
大多数笔记本内核都有,如果没有,可以通过
pip install awswrangler
安装。