最近一直在研究数据分析的相关知识,我将一点一滴的分享我所学到的,从百度统计开始。百度统计是网站数据统计和分析的有力工具。它从六个维度进行趋势分析、来源分析、页面分析、访客分析、定制分析、优化分析,帮助网站优化、用户定位、营销推广,打通网站与用户的完美结合。趋势分析,可以知道网站的基本状态和用户活跃度;访客分析和用户自定义变量可以帮助我们了解网站访客的构成和各种属性,帮助我们明确用户的定位;页面分析、转化路径和事件跟踪可以帮助我们了解用户的操作行为,帮助我们合理安排页面布局和层次,优化网站设计,提高转化;来源分析,优化分析,指定广告跟踪,可以帮助我们了解网站的营销推广状况,监控各种网络媒体的推广效果,优化SEO。
7、数据指标|移动应用 数据分析体系考核关键指标:参与度分析主要分析用户的活跃度;渠道分析主要分析渠道推广的效果;功能分析主要分析功能活跃度、页面访问路径、转化率;用户属性分析主要分析用户特征。用户规模和质量的分析包括五个常用指标:活跃用户、新增用户、用户构成、用户留存率和每个用户的总活跃天数。活跃用户是指在一定统计周期内启动了某个应用(APP)的用户。根据统计周期的不同,活跃用户数可分为日活跃数(DAU)、周活跃数(WAU)和月活跃数(MAU)。
根据统计时间跨度的不同,分为日新增用户、周新增用户和月新增用户。新用户的指标主要是衡量营销推广渠道效果的最基本指标;另一方面,新用户占活跃用户的比例也可以用来衡量产品的健康程度。如果一个产品的新用户比例过高,说明产品的活跃度来自推广,这是非常值得关注的,尤其是用户的留存率。以周活跃用户为例。周活跃用户包括以下几类用户,包括本周回归用户,N周连续活跃用户,忠实用户,持续活跃用户。
8、 数据分析系列-零售数据指标9、 数据分析-评估指标(F1score和ROC曲线
这里我介绍数据分析的两个评价指标,f1评分和ROC曲线。在介绍F1score和ROC曲线之前,我们首先要了解以下几个概念:什么是混淆矩阵?我们来看下图:注意上图中,蓝点为正,红点为负。一般来说,从医学的角度来说,阳性代表有病或者病毒,阴性代表正常。上述模型中有多少真阳性、真阴性、假阳性和假阴性?
我们来学习一个衡量模型性能的方法,精度。准确度如何?我们继续引用上图,准确率是图表所有数据中正确分类的点数,是正确分类的点数占总点数的比率。数学公式是正确分类精度的点数/总点数,上图中,正确的分类是真正(6) 真负(5)11;总点数为14,上图准确率为11/140.7857。在知道准确率之前,我们先来看看下面这张医学预测图:准确率的定义是所有预测的阳性点有多少是真阳性。