Apache Spark开源项目点评

spark

Scala

Apache Spark - 一个用于大规模数据处理的统一分析引擎

fork
26,424
star
34,591

data-science-ipython-notebooks

Python

数据科学Python笔记本。深度学习(TensorFlow、Theano、Caffe、Keras)、scikit-learn、Kaggle...

fork
7,422
star
24,418

redash

Python

让你的公司以数据为导向。连接到任何数据源,轻松实现可视化、仪表盘和分享你的数据。

fork
3,881
star
22,339

docker_practice

Go

学习和了解Docker&容器技术,并进行真正的DevOps实践!

fork
5,440
star
21,593

pdf

编程电子书,电子书,编程书籍,包括C,C#,Docker,Elasticsearch,Git,Hadoop,HeadFirst,Java,...

fork
5,811
star
19,111

cube.js

Rust

📊 Cube - 用于构建数据应用的无头商业智能

fork
1,463
star
14,281

flink-learning

Java

flink learning blog. http://www.54tianzhisheng.cn/ 含 Flink 入门、概念、原理、实...

fork
3,606
star
13,008

BigData-Notes

Java

大数据入门指南 :star:

fork
3,753
star
12,988

horovod

Python

用于TensorFlow、Keras、PyTorch和Apache MXNet的分布式训练框架。

fork
2,146
star
12,900

technology-talk

汇总java生态圈常用技术框架、开源中间件,系统架构、数据库、大公司架构案例、常用三方类库、项目管理、线上问题排查、个人成长、思考等知识

fork
3,645
star
12,865

deeplearning4j

Java

用于使用JVM部署和训练深度学习模型的工具套件。亮点包括为keras、tensorflow和onnx/pytorch导入模型,一个用于运行...

fork
4,929
star
12,715

ds-cheatsheets

统治世界的数据科学作弊表清单

fork
3,371
star
11,664

dev-setup

Python

macOS开发环境设置。 简单易懂的说明,为Vim、Sublime Text、Bash、iTerm、Python数据分析、Spark、H...

fork
1,147
star
5,854

pipeline

Jsonnet

PipelineAI Kubeflow分布

fork
989
star
4,145

gatk

Java

GATK 4及以上版本的官方代码库

fork
519
star
1,353

awesome-ada

与Ada和SPARK编程语言相关的超强资源的精选列表

fork
67
star
446

RecordFlux

Ada

可验证的二进制解析器、消息生成器和协议状态机的正式规范和生成

fork
9
star
92

ecomm_sales_pipeline

Python

电子商务数据管道

fork
0
star
1