学海无涯机电社区

 找回密码
 立即注册
搜索
查看: 368|回复: 0
打印 上一主题 下一主题

目的是什么

[复制链接]
威望
129
金钱
113
贡献
3491

124

主题

160

帖子

3491

积分

论坛元老

Rank: 8Rank: 8

积分
3491
跳转到指定楼层
楼主
发表于 2020-8-5 14:37:43 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
数据分析是指用适当的统计分析对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。那么做数据分析的目的是什么?
 1:分类



  检查未知分类或暂时未知分类的数据,目的是预测数据属于哪个类别或属于哪个类别。使用具有已知分类的相似数据来研究分类规则,然后将这些规则应用于未知分类数据。



  2:预测



  预测是指对数字连续变量而不是分类变量的预测。



  3:关联规则和推荐系统



  关联规则或关联分析是指在诸如捆绑之类的大型数据库中找到一般的关联模式。



  在线推荐系统使用协作过滤算法,该协作过滤算法是基于给定的历史购买行为,等级,浏览历史或任何其他可测量的偏好行为或什至其他用户购买历史的方法。协同过滤可在单个用户级别生成“购买时可以购买的东西”的购买建议。因此,在许多推荐系统中使用了协作过滤,以向具有广泛偏好的用户提供个性化推荐。



  4:预测分析



  预测分析包括分类,预测,关联规则,协作过滤和模式识别(聚类)之类的方法。



  5:数据缩减和降维



  当变量的数量有限并且可以将大量样本数据分类为同类组时,通常会提高数据挖掘算法的性能。减少变量的数量通常称为“降维”。降维是部署监督学习方法之前最常见的初始步骤,旨在提高可预测性,可管理性和可解释性。



  6:数据探索和可视化



  数据探索的目的是了解数据的整体情况并检测异常值。通过图表和仪表板创建的数据浏览称为“数据可视化”或“可视化分析”。对于数值变量,可以使用直方图,箱形图和散点图来了解其值的分布并检测异常值。对于分类数据,请使用条形图分析。



  7:有监督学习和无监督学习



  监督学习算法是用于分类和预测的算法。数据分类必须是已知的。在分类或预测算法中用于“学习”或“训练”预测变量和结果变量之间关系的数据称为“训练数据”。从训练数据中学到算法后,将该算法应用于具有已知结果的另一个数据样本(验证数据),以查看其与其他模型相比具有哪些优势。简单线性回归是监督算法的一个示例。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋| 学海无涯机电社区  

GMT+8, 2024-4-26 15:19 , Processed in 0.101868 second(s), 28 queries .

Powered by Discuz!

© Comsenz Inc.

快速回复 返回顶部 返回列表