## 推荐引擎 ~~~ -- 创建用户信息表(smb_user_meta) create table smb_user_meta ( user_id string, --用户ID,可以是AID,device id,淘宝ID等各种唯一标识用户身份的ID。不能出现(\001-\003)特殊字符。以下user_id字段同此意 tags string, --标签-标签值kv串。不同tag之间用\002分隔,tag和value之间用\003分隔基本格式:t1\003v1\002t2\003v2…例子:比如用户有两个标签年龄和性别,tag可以取age,gender;value取对应的值,如18、1,这条记录可编码为ag\00318\002gender\0031tags字段每个KV组中value的取值类型信息由user_meta_config给出更多信息参见【注释1】 plates string --板块区分字段,多个板块code用逗号分隔【注释3】 ) partitioned by (ds string) ; --创建用户属性维度表(smb_user_meta_config) create table smb_user_meta_config ( config_name string, config_value string ) partitioned by (ds string) ; -- 创建物品信息表(smb_goods_item_meta) create table smb_goods_item_meta ( item_id STRING, -- 物品ID,唯一标识 category STRING, -- 物品所属类目,最好以ID的形式给出。只支持单类目。如果要表示多分类,在properties中描述 keywords STRING, -- 关键词串。关键词可以有权重(需要归一化到0-1之间),也可以没有权重,没有权重时所有词的权重都是1。Keywords之间用\002分隔,keyword和score之间用\003分隔(如果score存在)基本格式:kw1\003s1\002kw2\003\s2\002… description STRING,-- 用于描述这个物品的一段文本 properties STRING,-- 属性-属性值kv串。不同key之间用\002分隔,key和value之间用\003分隔。不同property的key最好以ID的形式给出。基本格式:k1\003v1\002k2\003v2…]例子:比如电影作为item,properties中的key包括演员、风格,取值分别为巩俐、爱情剧,这条记录的properties字段可以编码为actor\003Gong Li\002style\003Love更多信息参见【注释1】 item_info STRING,-- 物品的业务信息,KV格式。不同KV之间以\002分隔,key和value之间以\003分隔。可以留NULL。item_info和properties的区别在item_info不参与特征提取的计算 update_datetime DATETIME, plates STRING ) partitioned by (ds string) ; --创建物品属性维度表(smb_goods_item_meta_config) create table smb_goods_item_meta_config ( config_name string, config_value string ) partitioned by (ds string); -- 创建用户行为表(smb_goods_user_behavior) create table smb_goods_user_behavior ( user_id STRING, act_obj STRING, obj_type STRING, bhv_type STRING, bhv_amt DOUBLE, bhv_cnt DOUBLE, bhv_datetime DATETIME, content STRING, pos_type STRING, position STRING, env STRING, trace_id STRING, plates STRING ) partitioned by (ds string) ; -- 创建可推荐物品表(movielens_rec_item_info) create table smb_goods_rec_item_info ( item_id STRING, item_info STRING, class STRING, plates STRING ) partitioned by (ds string) ; ~~~