加入收藏 | 设为首页 | 会员中心 | 我要投稿 常州站长网 (https://www.0519zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 云计算 > 正文

在云端你必备的5个机器学习技能

发布时间:2021-05-12 20:45:11 所属栏目:云计算 来源:互联网
导读:如果IT专业人员想在云端实现任何类型的AI策略,都需要了解数据工程。数据工程包含一系列技能,这涉及数据整理和工作流开发领域,以及软件架构知识。 IT专业知识的这些不同领域可以分解为IT专业人员应完成的不同任务。例如,数据整理通常涉及数据源标识、数据

如果IT专业人员想在云端实现任何类型的AI策略,都需要了解数据工程。数据工程包含一系列技能,这涉及数据整理和工作流开发领域,以及软件架构知识。

IT专业知识的这些不同领域可以分解为IT专业人员应完成的不同任务。例如,数据整理通常涉及数据源标识、数据提取、数据质量评估、数据集成以及在生产环境中执行这些操作的管道开发。

数据工程师应该习惯使用关系数据库、NoSQL数据库和对象存储系统。Python是一种流行的编程语言,可结合批处理和流处理平台(例如Apache Beam)以及分布式计算平台(例如Apache Spark)使用。即使你不是专业的Python程序员,只要具备一定的语言知识,你都可以从针对数据工程和机器学习的各种开源工具中提高技能。

数据工程在所有主要云端都得到很好的支持。AWS提供全面的服务来支持数据工程,例如AWS Glue、Amazon Managed Streaming for Apache Kafka(MSK)和各种Amazon Kinesis服务。AWS Glue是数据目录以及提取、转换和加载(ETL)服务,其中包括对计划作业的支持。MSK是数据工程管道的有用构建块,而Kinesis服务对于部署可扩展流处理管道特别有用。

Google Cloud Platform则提供Cloud Dataflow,这是一项托管的Apache Beam服务,支持批处理和Steam处理。对于ETL流程,Google Cloud Data Fusion提供基于Hadoop的数据集成服务。Microsoft Azure还提供多种托管数据工具,例如Azure Cosmos DB、Data Catalog和Data Lake Analytics等。


模型构建

机器学习是发展良好的学科,你可以通过研究和开发机器学习算法来发展自己的职业。

IT团队使用工程师提供的数据来构建模型,并创建软件以提出建议、预测价值和对条目进行分类。重要的是要了解机器学习技术的基础知识,即使很多模型构建过程都是在云端自动完成。

作为模型构建者,你需要了解数据和业务目标。你需要构想解决方案来解决问题,并了解如何将其与现有系统集成。

现在市场上提供现成的产品,例如谷歌的Cloud AutoML,这套服务可以帮助你使用结构化数据以及图像、视频和自然语言来构建自定义模型,而无需对机器学习有太多的了解。而Azure在Visual Studio中提供ML.NET模型构建器,该模型构建器提供界面用于构建、训练和部署模型。

(编辑:常州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读