大数据IE实验备考3——概率论实验
3 概率论实验3.1 概率论内容介绍3.1.1 概率论介绍概率论是研究随机现象数量规律的数学分支。随机现象是相对于决定性现象而言的,在一定条件下必然发生某一结果的现象称为決定性现象。 概率论是用来描述不确定性的数学工具,很多数据挖掘中的算法都是通过描述样本的概率相关信息或推断来构建模型。 3.1.2 实验介绍本章节主要实现概率与统计相关的知识点,主要用到的框架是 numpy 和 scipy 框架。 3.2 概率论内容实现导入相应库: import numpy as npimport scipy as sp 3.2.1 均值实现数据准备 ll = [[1,2,3,4,5,6],[3,4,5,6,7,8]] 代码输入: np.mean(ll) # 全部元素求均值 结果输出: 4.5 代码输入: np.mean(ll,0) # 按列求均值,0代表列向量 结果输出: 代码输入: np.mean(ll,1) 结果输出: 3.2.2 方差实现数据准备: b = [1,3,5,6]ll =...
大数据IE实验备考2——线性代数实验
2 线性代数实验2.1 线性代数内容介绍2.1.1 线性代数介绍线性代数是一门被广泛运用于各工程技术领域的学科。用线性代数的相关概念和结论,可以极大地简化数据挖掘中相关公式的推导和表述。线性代数将复杂的问题简单化,让我们能够对问题进行高效地数学运算。 线性代数是一个数学工具,它不仅提供了有助于操作数组的技术,还提供了像向量和矩阵这样的数据结构用来保存数字和规则,以便进行加,减,乘,除的运算。 2.1.2 代码实现介绍numpy 是一款基于 Python 的数值处理模块,在处理矩阵数据方面有很强大的功能与优势。因为线性代数的主要内容就是对矩阵的处理,所以本章节主要的内容都是基于 numpy 进行展开。另外也会涉及到方程组求解,所以也会用到数学科学库 scipy。 2.2线性代数实现导入相应库: import numpy as npimport scipy as sp 2.2.1 reshape 运算在数学中并没有 reshape 运算,但是在 numpy 运算库中是一个非常常用的运算,用来改变一个张量的维度数和每个维度的大小例如一个 10×10...
大数据IE实验备考1——基础数学
1 基础数学1.1 基础数学实验介绍1.1.1 内容介绍基础数学知识在数据挖掘领域有着大量的应用,尤其是在算法设计和数值处理方面。本章节的主要目的就是基于 Python 语言和相应的基础数学模块,实现一些常用的数学基础算法,为进入数据挖掘的学习提供基础支持。 1.1.2 框架介绍本章节使用到的框架主要包括 math 库, numpy 库和 scipy 库。math 库是 Python 的标准库,提供一些常用的数学函数; numpy 库是 Python 的一个数值计算拓展库,主要用于处理线性代数,随机数生成,傅里叶变换等问题;scipy 库主要用于统计,优化,插值,积分等问题的处理。 1.2 基础数学实现导入相应库: import mathimport numpy as np 1.2.1 ceil 实现ceil(x) 取大于等于x的最小整数值,如果 x 是一个整数,则返回自身。 代码输入: math.ceil(4.01) 结果输出: 5 代码输入: math.ceil(4.99) 结果输出: 5 1.2.2 floor 实现floor(x) 取小于等于 x 的最大的整数值,如果...