keras 回归问题中分类变量的嵌入

k10s72fa  于 2022-11-13  发布在  其他
关注(0)|答案(1)|浏览(130)

使用iris数据集作为假设的Hello World示例:

import pandas as pd
from sklearn import datasets

iris = datasets.load_iris()
df = pd.DataFrame(iris['data'], columns = iris['feature_names'])
df['iris_class'] = pd.Series(iris['target'], name = 'target_values')
df['iris_class_name'] = df['iris_class'].replace([0,1,2], ['iris-' + species for species in iris['target_names'].tolist()])
df.columns = df.columns.str.replace("[() ]", "")

print(df.head())

假设我想使用tf.keras.layers.嵌入而不是one-hot/dummy编码作为ANN的一部分进行回归。例如:

鸢尾类名称+瓣宽cm+瓣长cm-〉瓣长cm

其中sepallengthcm是因变量。我遇到了this

city_lookup = tf.keras.layers.StringLookup(vocabulary = city_vocabulary, mask_token = None);
city_embedding= tf.keras.Sequential([
    city_lookup,
    tf.keras.layers.Embedding(len(city_vocabulary) + 1, embedding_dimension)
  ], "city_embedding")
  
city = features["city"]
city_embedding_output = city_embedding(city)

但是我不知道如何在我的用例中使用它。欢迎任何的指点。谢谢!

uqdfh47h

uqdfh47h1#

您可以将iris_class_nameMap到n维矢量表示,然后与其他连续要素连接:
第一个
由于您有3个唯一的虹膜类名称,您也可以简单地手动创建一个整数到矢量字典,但这取决于您。

相关问题