知乎清华:1亿个行为数据开放查询二者正式对外绽放基于知乎的大周围富文本查问和引荐数据集“ZhihuRec”。此数据集里包蕴了知乎中上亿个行文数据,这也是目前邦内天性化数据聚集,最大的现实交互数据集。
动作一个大型数据集,ZhihuRec具有社交化问答场景中的细致音讯,笼罩了知乎10天内、79.8万用户、16.5万个题目、55.4万个回复、24万个作家、7万线万用户搜寻动作日记,保存了无缺的用户交互(比如点击、跳过、搜寻等)、机会和实质音讯,且所罕睹据均通过脱敏管束。
该数据集可用于评估常例top-N引荐、按次引荐和上下文感知引荐中的算法操纵,还可用于集成搜寻和引荐以及带有负反应的引荐。 其余,该数据集不光可能用于引荐磋议,还可能操纵于用户筑模(比如,性别预测,用户意思预测),搜寻和引荐体例的组合以及其他风趣的中央。