拟合功能
Data Studio 包含强大的线性拟合、多项式拟合、非线性拟合功能、适用于各类基本初等函数,以及相对复杂的 Gaussian 函数、Gamma 函数、Richards 函数等。其内置多种拟合函数,包含针对 2D 模型的11类、68种内置函数,以及针对 3D 模型的7类、25种内置函数。此外,用户可以根据自身需求,新建并保存自定义Python函数并进行数据拟合。拟合过程中,用户选取模型后,可以自定义设置拟合的初始参数,拟合后可以在“详细”页面查看拟合参数、均方误差、相关系数等参数并导出到文件。为便于使用者在近百种函数中迅速找到拟合效果更好的模型,Data Studio 提供的曲线搜索功能可以自动采用所有模型分别对数据进行拟合,并根据拟合的均方误差值对模型优劣进行排序,如图4所示。
图1 数据拟合内置2D函数(动图)
图2 2D 拟合结果展示(动图)
图3 拟合曲线积分计算展示
图4 曲线搜索功能(动图)
数据分析功能
借助 Data Studio,可以通过检查及删除离群点、检查线性相关性筛选自变量的方式进行数据清洗。利用 Lowess,Savitzky-Golay 算法对曲线光滑处理。并利用小提琴图、多类小提琴图、柱状图等图表分析数据点分布,快速了解数据概况。通过二维散点图、伪 3D 散点图、线性相关性热力图可视化分析数据的相关性。以及利用 PCA,LDA 等方法进行模型的建立和导出。
图5 曲线光滑
图6 相关性分析: a)伪3D散点图、b)线性相关性热力图
数据概况分析:a)小提琴图、b)柱状图
图7 LDA建模
读取曲线数据
读取图片中的曲线数据功能,手动选择和自动选择数据点。
图8读取曲线数据
Data Studio功能列表
1. 曲线拟合,线性拟合、多项式拟合、基本函数拟合、非线性拟合,拟合后可查看拟合参数、均方误差、相关系数等并导出到文件。
2. 曲线搜索,自动采用所有模型分别对数据进行拟合,按均方误差值对模型优劣进行排序。
3. 数据概况分析,小提琴图、多类小提琴图、柱状图、多类柱状图。
4. 离群点分析,Z-Score、LOF(局部异常因子)。
5. 相关分析,二维散点图、伪3D散点图、线性相关性热力图。
6. 自变量筛选,相关系数筛选。
7. 建模,PCA(主成分分析)。
8. 自定义python函数拟合。
9. 读取pdf文件中的表格。
10. 读取图片中曲线数据。
11. 读取Mysql 数据库。
12. 读取mat 格式文件。
13. Pearson,Spearman,Kendall 相关系数计算。
14. 读取图片中曲线数据自动识别数据点功能。
15. 表格基本操作与运算。
16. 处理数据中空值。
17. 拟合后计算拟合函数值,导数,积分。
18. LDA降维分析。
19. 计算数据基本统计信息。
20. 曲线光滑功能:Lowess,Savitzky-Golay算法。
14-20为当前版本新增功能。