Python数据分析师自学(01)

Python数据分析师自学(01),第1张

Python数据分析

大家好!在大数据时代,数据分析师成为了不可或缺的热门行业,数据的处理分析能力也成为计算机人才的全面能力要求,所以,小远想与大家一起学习进步掌握洞察数据的能力,希望喜欢和选择这个行业的我们都可以潜下心来专心学习!

进行数据分析需要的一些能力与天赋:

  • 中观能力:真正的专业程度,不仅包括理论知识,更重要的是可以实践上手,作出真正的成果的能力。

  • 微观能力:有效的沟通力和快速的发散力和理解力,找到问题的切入点,快速的解决业务方问题。

  • 宏观能力:将当前业务与实际社会热点,行业风口相联系,提前预判,做出更好的决策。

实例引入一:京东App产品分析

分析角度:

  • 如何看待京东App

  • 整体数据分发效率

  • 漏斗分析

  • 新用户分析

1. 如何看待京东App

  • 引流(界面)

  • 漏斗(货)

  • 用户(人)

2. 整体数据分发效率

  • CTR:CTR=点击UV/曝光UV,反应用户点击欲望的指标

    点击UV:每天有多少用户点击进入页面

    曝光UV:每天有多少用户看到了页面

  • 人均访问页面数:总访问页面数(PV)/总访问UV

    总访问页面数PV:点击所有也买呢次数总和

    总访问UV:点击页面的人数总和

3. 漏斗分析

  • 搜索主界面uv:引流渠道

  • 店面uv:热点,搜索

  • 详情页uv:客服,评论,设计

  • 加入购物车uv:尺寸,颜色

  • 提交订单uv:地点

  • 收银台uv:收银方式

  • 交易成功uv

4. 新用户分析

  • 优惠卷的分发

  • 文案

  • 用户来源

实例引入二:芝麻信用分建模

分析角度:

  • 背景

  • 授信模型

  • 模型落地

1. 背景

数据分析师在金融行业基本上有两种角色:

  • 数据建模师:对算法的理解较深

  • 风控分析师:在专业的基础上了解大量的行情和法律法规

互联网金融在产品对象上分为to B 和to C

  • to B:对企业整体进行信用评估

  • to C:对个人的个人信用分

2. 授权模型

模型内容:

  • 身份特质

  • 行为偏好

  • 人脉关系

  • 信用历史

  • 履约能力

数据处理:

  • 检验数据的合理性,有效性,缺失性

  • 字符串字段处理

  • 数据标准化

建立拟合模型:

y=F(x1,x2,x3,x4,x5)

模型评估与优化:

查准率+查全率

ROC曲线下的面积AUC>0.6

不断的在运行周期中进行优化

3. 模型落地

在基础的任务做完之后,芝麻信用就可申请招联金融信用额度,与别的公司进行合作。

  • 公司提供用户信息,芝麻信用给出反馈预测

  • 公司根据预测的概率来估计模型的准确度

  • 如果模型的准确率达到公司的要求双方则可能合作

一起学习的小伙伴可以互关哦~

欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/langs/919066.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-05-16
下一篇2022-05-16

发表评论

登录后才能评论

评论列表(0条)

    保存