Github 2019 年最值得关注的数据科学项目 Virgilio(维吉尔) 中文版

项目地址:https://github.com/clone95/virgilio

目前为止: [7,128] star [1,303] fork,希望你看到之后能给它添加一个 star

这个项目首次提交在 2019 年 3 月 12 日,原名叫https://github.com/clone95/Data-Science-Study-Paths-March-2019,一个月的时间就有 6k+ 个 star,经常排在 http://github.com/explorer 的前几位。当然最近被榜单被 996icu 占了。

map.png

关于项目改名:

Virgilio.png

项目作者把项目名改成维吉尔(Virgilio),这是 13 世纪末意大利诗人但丁所著长诗《神曲》中旦丁的导师。

这是什么地方?

通过互联网进行学习意味着在无限的混乱信息丛林中游泳,在快速变化的创新领域更是如此。

当你试图接近一个没有真正 “路径” 的新主题时,你有没有感到不知所措?你是否妨碍获得深厚的知识和应用它的能力?

嗨,我是 维吉尔(Virgilio)

就像几年前我和 但丁(Dante) 一样,在你的互联网旅程中,我将成为你的导师和参考点,为你提供完整的有机学习途径,包括多个领域,工具,技能等。

我是怎么做到的?

我试图简明扼要,以避免信息开销。

我按层次结构和复杂程度组织了内容,以便你对事物的运作方式有一个连贯的想法。

你将学习如何通过实践项目理解和应用理论,并仔细遵循我的提示和技巧,你将从头开始掌握新技能。

你不需要任何先前的主题知识,但对编程和高中数学有信心,以理解和实现大多数概念。

此处列出的每个来源都是免费或开源的。

我最感兴趣的是数据科学,因为我试图预测耶路撒冷的陨落,但是你知道,那时我们没有那么多的计算能力!

你能在这里找到什么?

我为你打包了几种类型的指南:

  • 职业:完整的学习路径,指导你从头开始掌握新技能。
  • 主题:关于由子领域组织的特定主题,方法和现实应用的综合指南。
  • 专业化:个人技能的垂直指南。
  • 工具:单一工具或技术的深入指南。
  • 研究:对最新论文和技术文件的最新审查和解释。
  • 元(Meta):这些主要是关于如何学习和接近新概念的指南。

如果你发现此 repo 有用,我请你 star 一下,与你的朋友和同事分享,然后点击 watch,因为每天都会有更新!

我的目的是什么?

我的目标主要是帮助人们开始使用创新的领域和技术,即使你从未尝试过编写代码,或者你需要深入的数学评介,我也会给你这样的基础。因此,你可以成为一名学生,另一个领域的工作人员或经理,你将在这里找到你需要做好准备,以应对未来几年肯定会发生的破坏性和不可预测的市场和社会转型。

我的价格:我在这里等你,免费。如果你发现我在某种程度上有所帮助,我只要求你留下一个 star ,点击 watch,每次你有机会时请分享我。让我们开始我们的旅程!

新接触数据科学?

基础 Python

基础数学 - 即将推出

高级 Python - 即将推出

高级数学 - 即将推出

Python 数据科学

数学数据科学 - 即将推出

完整的学习路径

机器学习研究路径

商业智能研究路径 - 即将推出

云计算研究路径 - 即将推出

专业化

数据预处理

数据收集 [即将推出 - 下一步]

数据可视化 [即将推出]

有效沟通 [即将推出]

有效陈述 -

实用决策 [即将推出]

工具

Latex

Wolfram Alpha

GeoGebra

正则表达式

即将推出

主题

DialogFlow 和 Flask 打造 ChatBot

研究

Zotero

最新论文 [即将推出]

关于专业化

你可以按顺序选择它们或选择最适合你的那个,但我建议你至少要一次把它们都看完。

我计划了两种类型的专业化:硬技能和软技能

前者是关于技术流程,是每个处理数据的人的核心工具包。使用数据是一种艺术形式,经验法则和最佳实践将帮助你了解处理它们的方式。你需要对如何处理数据产生一种 “感觉”,这种 “感觉” 主要是由情况和经验驱动的。因此,这些专业将强烈关注练习和练习。

后者是关于… 所有未写在技术书籍中的东西。使用和掌握它们,因为它们是你真正的价值促成者。你可以成为世界上最好的开发人员或工程师,但如果你无法向受众传达你的建议和发现,或者使用数据来建议现实世界中的实际行动,那么你对公司来说就毫无用处。

关于主题

单个主题将按字段分割,它们可以触及实际应用程序,方法,技术栈,最佳实践等。

关于工具

“工具” 部分将提供有关你需要了解的特定技术 / 语言 / 方法的所有指南!它们将为你提供彻底探索和掌握手头工具的方法。

订阅我们新闻发布和更新的FACEBOOK组

翻译人员

@jiaxianhua (iOSDevLog)

在我准备翻译之前就已经有中国人准备翻译成中文,后来共有 4 个中国人想要翻译成中文。

我们重新建了一个 https://telegram.org/ 中文聊天群 Virgilio_cn,并把 @Clone95 拉进群,准备我们的翻译计划。

一开始人打算可以使用有团队协作功能的 蚂蚁笔记 Leanote,它具有以下特性。

  • Markdown 编辑器
    实时同步预览,你只需使用键盘专注于书写文本内容,就可以生成印刷级的排版格式。
  • 详细历史纪录
    每次保存都在后端备份,轻松查找,一键恢复。
  • 实时同步 - 云协作版
    丰富的团队权限管理完整的文档树型结构
    支持Docker,私有云部署实时IM群聊讨论

最重要的是它是开源的:https://github.com/leanote

于是我把它部署在服务器。

后来 @Clone95 找到了 WebLate

Weblate 是一个基于网络自由软件持续本地化系统。

WebLate

这个也是开源的,我把它也部署在服务器上http://67.218.132.50/

部署过程:https://www.jianshu.com/p/f3cd7dfd48d1

Weblate 支持多种翻译格式,我选择把 md 文件改换成 xliff 再上传。

Weblate 还支持机器翻译https://docs.weblate.org/en/latest/admin/machine.html

大多数翻译 API 要收费,也包括流行的 Google Translate。最终我选用了 Baidu API machine translation ,每月翻译字符数低于200万,享免费服务;超过200万字符,需按照49元人民币/百万字符支付当月全部翻译字符数费用(包括之前免费的200万字符)。

转换几个文件后,翻译群里的小伙伴们就开始翻译。之后又发现 Xliff 要把 md 文件里的 “<>&” 这些符号替换成占位符。好麻烦,还不如直接用 json 格式。

转换方式:https://www.jianshu.com/p/323a5d033767

最终还是用 google translate api 直接翻译 md 文件。

转换过程:https://www.jianshu.com/p/5835eb34cbb1

用 vscode 一边英文,一边中文对照着改通顺。

vscode.png

翻译中肯定有许多不专业的地方,特别是 WolframAlpha 的翻译,请大家将不准确的地方提出,或者加入我们的 Telegram / 微信翻译群。

微信公众号:AI开发日志(AIDevLog)

AI开发日志

最后还是请大家 star 并分享给你的好友们!

https://github.com/clone95/virgilio

iOSDevLog wechat
欢迎您扫一扫上面的微信公众号,订阅我的博客!