而有些团队则是使用标准软件开发IDE,提及最多的是Pycharm和VSCode。
使用Pycharm的一家公司Hotelmize称,这是最好的Python IDE。
而使用VSCode的公司则为其正名。
VSCode易于与Azure连接,并提供了许多基于ML的扩展。
对于使用R语言的团队来说,RStudio是他们最好的选择。
还有一项工具——GitHub。我想这对每个AI团队都是福音,初创公司更是。
调查结果正是如此,GitHub因为其免费、强大的版本控制系统、共享功能,对团队来说都是超级有用的。
对于最流行的编程语言里,Python、R语言上榜,竟还有一个Clojure。
值得一提的是,对于环境/基础设施的设置方面,有一些团队给出了以下建议:
-
AWS作为部署平台(Simple Report)。
-
Anaconda是我们运行ML实验的首选工具,因为它的活代码功能,可以用来将软件代码、计算输出、解释性文本和多媒体资源结合在一个文档中。(Scanta)
-
Redis作为内存中的数据结构存储,由于它支持不同类型的抽象数据结构,如字符串、列表、映射、集、排序集、HyperLogLogs、位图、流和空间索引等,因此Redis作为内存中的数据结构存储占据了主导地位。(Scanta)
-
Snowflake和Amazon S3用于数据存储。(Hypergiant)
-
Spark-pyspark—-非常简单的api,用于大数据的分配作业。(Hotelmize)
机器学习框架
机器学习框架也必不可少。而这一部分,选择的工具有很多。
调查结果如下:
软件开发设置
-
IDE:Jupyter Lab+NB扩展(少数用Deepnote),Colab和PyCharm、VSCode(R用户喜欢 R studio)
-
Github
-
Python(大多数),R(部分)
机器学习框架
-
处理数据和可视化:Pandas + Matplotlib + Plotly
-
经典算法:Sklearn + XGBoost
-
深度学习:Tensorflow + Keras或Pytorch
MLOps
-
编排:Kubeflow,Airflow,Amazon Sagemaker,Azure
-
模型包装/服务:Kubeflow,MLflow,Amazon Sagemaker
-
模型从训练到推理的剖析和优化:pytest-benchmark、MLperf
-
实验管理:MLflow,Comet,Neptune
具体情况,是这样的。
软件开发设置
开发环境是每个团队工作流程的基础,而对于IDE,很多团队都喜欢Jupyter Notebooks和Jupyter Lab及其NB扩展。
(编辑:常州站长网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|