该平台帮助研究者将原始数据自动转换为可以被模型使用的特征数据,功能通过数据流形式实现,研究者可以通过修改参数和拖拽节点灵活改变特征抽取过程。下图是一个数据流示意图。
从数据导入和清洗为起点,DarwinML可自动建模并给出模型多方位评估结果,研究者只需要重点关注模型评估结果。研究者根据研究目标,自行返回去调整最初的数据清洗方案和模型设置,多次建模,选择符合研究需要的最终模型。
2)模型设计:根据数据自身特性,以及研究者的参数设定,自动构建搜索空间内的最优网络结构。网络结构会在平台中显示如下。
3)超参调优:对最优网络结构,结合数据特性,给出相匹配的最优超参组合,比如下图所示的“超参数”列中XGBClassifiler的learningRate和nEstimators等。
5)模型评估:给出查全率,查准率,AUC等基础指标值,并且从模型角度,给出重要列分析结果,从样本角度,给出单个样本的重要特征分析。
同时可以根据需要,我们也支持只使用部分功能。比如可以导入一组新患者的检查数据,使用上次训练好的模型,只做模型评估,来对这一组新患者的患病几率做预判。

