大数据时代:未来十年新趋势
现在,数据科学家是一个宽泛的头衔。我们一般把数据科学领域的角色分成 4 类,它们角色职能不同但有重叠。
1、数据架构师——开发数据架构,以有效地捕获、整合、组织、中心化和维护数据。


据特斯拉 AI 总监 A. Karpathy 说,不久的将来,我们可以不用写代码了。我们只需要找到数据,并输入到机器学习系统即可。此种场景下,软件工程师的角色会成为“数据监管者”。未来大多数程序员都不再需要复杂的软件仓库,不用写复杂的程序。程序员会从事搜集、清理、操作、标记、分析数据以及对神经网络产生的数据进行可视化的工作。机器学习正在引领一种新的计算范式,在该范式中训练机器才是关键技能。随着机器学习技术的普及,以及通过工具的抽象达到更高程度,我们会看到大部分编程工作会逐渐消失。最终,制造产品的大部分步骤将是屏幕上的拖拽、刷卡、指向和点击操作。
到 2025 年,预计全球每天将产生 463 艾字节(463*10^18 字节)数据,相当于每天212,765,957 张 DVD 的数据量!实际上,仅靠数据科学家,无法管理和处理这么庞大的数据。届时,人工智能很可能成为协助数据科学家处理数据的有效工具。自动化数据分析工具和机器学习会“聪明”到取代数据科学家做例行工作,比如探索性数据分析、数据清理、统计建模和构建机器学习模型。