使用iris数据集作为假设的Hello World示例:
import pandas as pd
from sklearn import datasets
iris = datasets.load_iris()
df = pd.DataFrame(iris['data'], columns = iris['feature_names'])
df['iris_class'] = pd.Series(iris['target'], name = 'target_values')
df['iris_class_name'] = df['iris_class'].replace([0,1,2], ['iris-' + species for species in iris['target_names'].tolist()])
df.columns = df.columns.str.replace("[() ]", "")
print(df.head())
假设我想使用tf.keras.layers.嵌入而不是one-hot/dummy编码作为ANN的一部分进行回归。例如:
鸢尾类名称+瓣宽cm+瓣长cm-〉瓣长cm
其中sepallengthcm是因变量。我遇到了this:
city_lookup = tf.keras.layers.StringLookup(vocabulary = city_vocabulary, mask_token = None);
city_embedding= tf.keras.Sequential([
city_lookup,
tf.keras.layers.Embedding(len(city_vocabulary) + 1, embedding_dimension)
], "city_embedding")
city = features["city"]
city_embedding_output = city_embedding(city)
但是我不知道如何在我的用例中使用它。欢迎任何的指点。谢谢!
1条答案
按热度按时间uqdfh47h1#
您可以将
iris_class_name
Map到n维矢量表示,然后与其他连续要素连接:第一个
由于您有3个唯一的虹膜类名称,您也可以简单地手动创建一个整数到矢量字典,但这取决于您。