PolYamoR的简介:Python和R之间的双向翻译器

PolYamoR的简介:Python和R之间的双向翻译器

时至今日,数据科学已经成为Python和R之间的主战场。在数据科学里,存在着让不同编程语言共存的方式。

但是编程语言的共存也有它的规则,就算是 Dataiku Data Science Studio (DSS) 系统可以使其顺畅,但是并非每个人都准备好接受这种共存的状态。

大家期待已久的解决方案

经过一年紧张的发展后,我们终于自豪地宣布PolYamoR —— 第一个可以在Python和R之间可以正向和反向的自动化翻译系统。PolYamoR是第一个能达到全透明,不矛盾、并且管理复杂编程的多语言编程系统。PolYamoR可以使纯Python代码翻译成纯R代码,反之亦然,这将引领一个意想不到的跨文化交流的新时代。

编码来源于GitHub

github.com/dataiku/PolY

现代的翻译系统依靠深度学习去运作。当然,PolYamoR也不例外。

我们通过提供数百万行Python代码和数百万行R代码,以及它们各自的翻译,训练出一个循环性的神经网络(Neural Network)。

当然,最早一次的翻译是很粗糙的。

惊艳的图型处理器(GPU)集群

经过十多个图形处理器,包含20个节点集群数千小时的训练,PolYamoR生成并清理出易于管理的代码。但是所产生的代码可能会特别长:

四不像?

PolYamoR最初由Python编写,但是因为一个团队成员的编码错误,该程序决定自行翻译为R。在改变主意以后,PolYamoR 现在是一半Python一半R并且足够稳定地去生产使用。

我们相信PolYamoR将会改变数据科学团队每日合作方式。很有可能在未来一天,一门通用语将会在不同层面的编程系统中产生并且使所有数据科学家的工作统一。但是与此同时,你可以根据自己的喜好,尝试染指R语言,或者Python,尽情享受数据科学里的编程之趣直到明年PolYamoR的亮相!

原文:Pandas Cheat Sheet for Data Science in Python

作者:Karlijn Willems

链接:goo.gl/wmnpSy