我试着和克雷恩合作,把伯特的模型做得更好。我使用名为Train_df的Pandas Dataframe 来存储我的数据。
x_train, x_val, y_train, y_val = train_test_split(train_df['text'], train_df['target'], shuffle=True, test_size = 0.2, random_state=random_seed, stratify=train_df['target'])
我使用函数TextFrom_ARRAY,因为当我想要将数据转换为BERT的要素时,我会使用PANDA Dataframe 读取数据。我得到了ValueError(ValueError:X_Train必须是List或NumPy数组)。
(x_train_bert, y_train_bert), (x_val_bert, y_val_bert), preproc = text.texts_from_array(x_train=x_train, y_train=y_train, x_test = x_val, y_test=y_val,
class_names= ["0", "1"],
preprocess_mode='bert',
lang = 'en',
maxlen=65,
max_features=35000)
我错过了什么?
1条答案
按热度按时间czq61nw11#
我找到了解决方案,现在它工作正常。