手机浏览器扫描二维码访问
第758章流形学习
姚梦娜提出的这个问题,对于常浩南来说,不难理解。
只是很难解决。
真要说起来的话,这涉及到文本挖掘、数据可视化、信息检索、数据挖掘、机器学习乃至人工智能等一系列问题。
如果真做到姚梦娜所设想的那样全自动化生产,那就是工业4.o了。
在1999年这个时间点上,显然不大现实。
但不可能完全实现这一整套东西,并不意味着其中没有可以作为突破口的部分。
比如数据挖掘和信息检索,就是千禧年附近很火热的研究方向。
其核心目的是从海量数据库和大量繁杂信息中提取出有价值的知识,并进一步提高信息的利用率。
实际上,在常浩南重生之前,飞机设计和制造领域已经开始应用这方面的技术,他本人也接触过不少。
但当年的他作为一个工科出身的普通技术人员,并没有太多理论功底。
而系统,则先需要构建出一个完整且可行的思路出来。
这就导致如今他脑子里空有一大堆名词,但却不知道哪個是破局的关键——
实际上,他此时就面临着无法从大量繁杂信息中提取出有价值信息的困境。
“信息……”
常浩南从旁边扯过一张纸,在纸的最中间写下了两个字。
在理想化的模型中,最好是一个数据就可以精确且唯一地描述一个含义。
也就是一维数据。
小学和中学时候做的应用题,大体上就是这样。
实际生活中面临的,其实大多数也是这种问题。
而对于稍复杂一些的情况来说,要完全描述一个含义,往往需要一组数据。
但与此同时,这一组数据又往往不只能描述这一个含义。
要想在数学上描述这种一组(多个)数据对应多个含义的现象,就需要将一组数据在不同的维度上进行展开。
这是由数学理论推向现实的情况。
而反过来,现实中收集到的信息,在多数情况下,本身就是已经展开过的高维数据。
而如果想要让计算机处理这些高维数据……
常浩南思索半晌,又在纸上写下了三个基本条件:
1、对原始高维数据进行压缩,降低原始高维数据的维度,进而节省存储空间,同时也降低高维数据的计算复杂度。
2、消除,或者至少降低隐藏在原始高维数据中的噪声。
3、提取到高质量的数据特征,提升后续的数据表示和分类任务的效果。
他在脑子里把这三条内容过了一下,然后试图让系统给出一个结果。
没有反应。
显然,这并不能被算作是“完整且可行”的思路。
你一个德鲁伊跑去修仙? 我过气爱豆,和天后恋爱很合理吧 斗罗之时空剑主 斗罗:霍雨浩获得炎帝模板 崩坏曝光:开拓命途冲跨虚数之树 无限:从火影开始的主神空间 现场改功法,你管这叫不懂修炼? 回乡种田:末世系统早到十年? 替嫁东宫,病弱太子日常为爱发疯 非法行医李逍遥,睚眦必报任逍遥 精灵世界的美食大师 人到三十,我家的豪门日常 长生从炼丹宗师开始 这个漫画家精神病吧 诸天降临:满级天赋 七零嫁不育军官,军嫂多胎被宠翻 快穿:倒霉炮灰挣命中,勿扰! 太子殿下被重生王爷极限宠 斗罗:我的分身模拟星神 从赘婿开始建立长生家族