seo营销网

数据质量对智能营销的深远影响

作为决定营销精准、智能与否的基础,数据价值对智能营销的重要意义不言而喻。在人人都说大数据、全球数据化的当下,如何评估数据质量,成为从业者们做好营销的一道基础必考题。
以下根据力美科技数据工程师口述整理,欢迎大家交流探讨~
1数据源
数据的广度、精度、量级共同构成数据价值的基础。
首先,用户的多样性决定了单一的数据源不足以描绘出立体、丰富的用户画像,这就要求数据来源全面、丰富,线上线下跨行业多维度数据的打通融合对还原用户随时随地的行为轨迹、兴趣爱好、标签特征尤为重要;
其次,数据精度,数据的粒度越细,对用户的画像和定位就越精准。以GPS数据为例,力美场景数据的GPS定位可以做到小数点后4-6位,精确到米级,与开放式的LBS定位相得益彰,有点有面,对用户的覆盖和捕捉更加精准;
第三是数据的量级。除第三方数据公司外,凡是真正做精准营销投放的技术公司都能获取到数据,区别就在于数据的量级,以及活跃度、有效性,有足够多的数据才有可能构建完整、立体的人群画像,才能筛选出真正有价值的流量并完美匹配。力美智能数据主要来源于覆盖95%以上智能设备、连续3年精准投放后的积累,以及其他合作方如TD(TalkingData、秒针等)、运营商、合作APP等方面的数据。
2数据挖掘
如何从纷繁复杂的海量数据中挖掘最有价值的信息,考验的是团队的技术、算法、行业经验。

结合自身广告业务,充分挖掘并利用这些数据的价值是一个系统工程。一方面需要投入大规模的硬件资源,并在其上构建的强大、健壮的分布式软件系统。另一方面在结合特定业务的基础上使用机器学习、深度学习等前沿领域的技术优化各个业务环节。
就力美科技而言,从2011年开始耗费大量资金逐步建立起由数百台服务器构成的大数据集群,力美科技自身的广告业务,使用先进的算法不断迭代优化广告投放中的两个核心问题:如何根据所投广告找到有价值的流量?如何根据预算以及市场竞争情况高效地动态出价?
对于第一个问题,通过智能反作弊系统、人群画像标签、点击率和转化率预估、速度智能控制系统等系统对流量进行筛选;对于第二个问题,使用最优化技术以及机器学习技术,构建了流量预估、预算智能分配、成交价格预测、动态出价等系统以较为经济的方式竞得需要的流量。在每一个子系统的构建过程中,力美算法团队谨遵科学研究的规则,对于每个子问题进行调研,依次经过数据清洗、特征抽取、模型选择与模型评估等流程,如下图的反作弊系统所示:

经过迭代优化,反作弊系统能够每天为再投广告过滤近30%左右的劣质流量。
3数据应用
养兵千日用兵一时,经过对数据源及数据清洗方法的基本评估,到了对数据价值评估的关键环节——数据验证,数据是否有效、有多大价值,从投放结果便可一目了然。
以力美科技目前的技术算法为例,智能反作弊系统通过人工+机器双重排查,可以过滤30%左右的异常流量;CTR预估模型性能优异,使得AUC可达0.8以上,更能结合动态出价大幅降低点击成本;而点击率平衡系统采用创新技术算法,基于最优化技术和机器学习算法,在保证广告项目整体点击率稳定的基础上,使ECPC降低30%左右。
早在去年,包括广告主在内的智能营销行业就逐步把大数据上升到企业战略高度,对数据的挖掘利用能力直接决定了智能营销的效果。力美科技也愿意以开放的心态与大家分享交流数据价值的挖掘和应用,共同促进行业健康发展。
标签:
seo营销网