您应该添加到简历中的7个开源数据分析项目

发布时间: 2020-08-28

总览

开源数据分析项目为您的简历增添了很多价值,并帮助您在面试中脱颖而出

这是您本月应开展的7个此类开源数据分析项目

介绍

我将给您一个提示,希望我在开始我的数据分析事业时有人给了我。当我在数据分析的死水中穿越充满障碍的旅程时,在登上自己的第一个职位之前,我经历了相当大的挣扎。我具备所有资格(或者我想),但是似乎有些不对劲。

我带到桌子和面试官所期望的差距是数据分析项目的经验。

数据分析项目为您的简历增加了很多价值,特别是如果您是初学者。大多数新手都会获得认证,但是添加开源数据分析项目将为您提供比竞争对手明显的优势。相信我,有数量惊人的开源数据分析项目供您使用。

在这里,我汇总了6月份创建或发布的顶级开源数据分析项目的列表。这是我每月项目系列的一部分,其中介绍了在GitHub上开源的最佳数据分析项目。

开源数据分析项目可增强您的简历

我已根据其领域将项目分为三类:机器学习、计算机视觉、其他开源数据分析项目,包括一个很棒的数据集

让我们分别查看每个类别。

开源机器学习项目

这是您学习机器学习的地方。我们将在这里介绍与机器学习有关的三个有用的开源项目。您可以根据自己的兴趣选择一个项目,也可以全部尝试。我试图使它们尽可能多样化,以便您会看到有关机器学习论文的项目以及构建机器学习管道的另一个项目。

带有插图和注释的机器学习论文

对于大多数专业人士,更不用说初学者了,阅读机器学习研究论文的前景相当艰巨。数据分析师和机器学习研究人员倾向于撰写极其技术性的论文,甚至专家也很难解码。这实际上是我们领域中最大的痛点之一。

因此,任何打破复杂性的努力总是值得欢迎的。这个有用的项目是数据分析和机器学习论文的集合,“其中包括插图,注释以及对技术关键词,术语和以前的研究的简要说明,这使阅读论文和获得主要思想变得更加容易”。

NeoML –机器学习框架

对于任何有一点数据分析知识的人来说,这都是一个非常有趣的项目。

NeoML是一个全面的机器学习框架,使我们能够构建,训练和部署机器学习模型。简而言之,我们可以建立一个端到端的机器学习管道,而不必花很多钱在开箱即用的解决方案上。

数据分析师和数据工程师可以将其用于计算机视觉和自然语言处理(NLP)任务,例如图像预处理,分类,文档布局分析,OCR以及从结构化和非结构化文档中提取数据。

这是我从其GitHub存储库中获取的NeoML的主要功能:

支持超过100种图层类型的神经网络

传统机器学习:20多种算法(分类,回归,聚类等)

CPU和GPU支持,快速推断

ONNX支持

语言:C ++,Java,Objective-C

跨平台:相同的代码可以在Windows,Linux,macOS,iOS和Android上运行

Google的Caliban机器学习

这是任何数据分析师都会喜欢的另一个项目,特别是如果您倾向于研究的话。我们通常很难从测试环境过渡到全面部署–这并非易事(我们真的应该感谢数据工程师所扮演的角色)。

Google当然会以Caliban的形式为我们提供潜在的解决方案。这是一个可帮助您在隔离的,可复制的计算环境中启动和跟踪数值实验的工具。Caliban由Google的机器学习研究人员和工程师开发。

正如他们所说,Caliban“使从工作站上运行的简单原型到在云上运行的数千个实验性工作变得容易”。以下是您应注意的主要重点:

在本地开发实验代码并在隔离(Docker)环境中进行测试

轻松浏览实验参数

将实验提交为Cloud作业,它们将在相同的隔离环境中运行

控制并跟踪工作 

开源计算机视觉项目

我对我们在计算机视觉中看到的进步感到惊讶(没有双关语!)。似乎每个月我坐下来写这篇文章时,我都会遇到越来越多的突破性框架和新方法,这些框架和新方法增强了该领域的最新水平。

组织现在正在全球搜寻计算机视觉人才,因此现在是开展这些项目并进入该领域的好时机。

基因图

如果我给您目标图像并要求您编写一个从头开始创建图像的计算机视觉程序该怎么办?是的,这就是计算机视觉的力量!

脉冲–脸部去像素器

这个开源项目迎合了稍微高级的数据分析师。要了解此项目的含义,我们需要掌握单图像超分辨率的概念。简而言之,这里的目的是从相应的低分辨率输入中构建高分辨率图像。

听起来像是经典的计算机视觉项目!

PULSE是解决此问题的新颖方法。PULSE是通过潜伏空间探索进行照片升采样的缩写,它以令人难以置信的高分辨率生成高分辨率和超逼真的图像。而且这是完全以自我监督的方式完成的,并不局限于训练过程中使用的特定降级操作员。

其他开源数据分析项目

这是几个不完全符合以上两个类别的开源数据分析项目。这实际上是两个截然不同的项目–一个迎合数据分析的初学者,而另一个则涉及强化学习的领域。

选择最适合您的一个,然后开始探索。

发表评论

您的电子邮箱地址不会被公开。