GitHub

Arctern项目正在积极开发中，预计2020年4月开源0.1.0版本。非常感谢您的关注！

下面对Arctern项目的主要内容进行介绍。

项目定位：

Arctern是一个面向大规模数据的地理信息分析引擎。定位如下：

面向领域需求提供领域API，提高上层应用的开发效率。
提供可扩展、低成本的分布式解决方案。
针对地理信息分析算法提供GPU加速能力。
构建GIS、SQL、ML混合分析能力。

分析引擎：

上图是Arctern 0.1.0的基本架构。Arctern分析引擎主要包含两部分内容，分别是地理信息数据处理（GIS）和地理信息数据可视化（Visualization）。当前版本包含OGC标准中常用的35个GIS API，涵盖几何对象的构造、访问、关系分析、度量。引擎中的可视化部分负责几何对象的渲染，API采用vega标准。与传统的web端渲染方案不同，Arctern采用服务器端渲染，可支撑亿级数据的轮廓图、热力图、散点图等渲染任务。在0.1.0版本中，地理信息数据处理与可视化均提供CPU/GPU两种实现，对外部提供统一的API，用户可根据需求灵活选择是否采用GPU加速。

数据接口方面，Arctern支持标准数值类型及WKB格式，支持json，csv，parquet格式的文件导入。内存层基于Arrow按列式组织数据，可提供与外部系统的零拷贝数据交换。

调用接口方面，Arctern开放C++、python绑定及Spark三层API，均为列式处理接口。API基于Arrow标准进行传参及返回。由于Spark自3.0版本开始支持GPU资源管理，当前Arctern的Spark接口仅支持面向Spark3.0的适配。

代码示例：

# 在pyspark上调用Arctern API

from pyspark.sql import SparkSession
import arctern

if __name__ == "__main__":
    spark = SparkSession \
        .builder \
        .appName("Arctern-PySpark example") \
        .getOrCreate()

    spark.conf.set("spark.sql.execution.arrow.pyspark.enabled", "true")
    arctern.pyspark.register(spark)

    within_df = spark.read.json('./example.json').cache()
    within_df.createOrReplaceTempView("within")
    spark.sql("select ST_Within(geo0, geo1) from within").show()
    spark.stop()

可视化效果：

Arctern项目将与Sulidae项目同步开源。Sulidae项目是ZILLIZ团队研发的一款前端可视化系统，提供web前端渲染与服务器端渲染的混合可视化方案，兼顾web前端渲染的交互速度、灵活性以及后端的大规模数据渲染能力。

Arctern 0.1.0版本将提供与Sulidae的适配，以下是热力图与轮廓图的可视化效果，交互数据规模一千万条：

近期工作：

v0.1.0

支持OGC标准中常用的35个GIS API。
支持面向大规模数据的轮廓图、热力图、散点图渲染。
提供基于Arrow标准的C++、python及Spark API。
提供基于CPU实现的Arctern引擎。
提供基于GPU加速的Arctern引擎。
提供与前端可视化项目Sulidae的适配。
API手册，安装部署文档。

v0.2.0

面向领域需求提供轨迹分析、地理信息统计分析的领域API。
面向领域API提供时空索引。
针对Spark3.0的性能调优。
提供更多的GIS API。
持续提升系统稳定性。

当前进展：

2020.03.10 达成

支持OGC标准中常用的35个GIS API。
支持面向大规模数据的轮廓图、热力图、散点图渲染。
提供基于Arrow标准的C++、python及Spark API。
提供基于CPU实现的Arctern引擎。
提供基于GPU加速的Arctern引擎。

欢迎来交流：

github

https://github.com/zilliztech/arctern

email

support@zilliz.com

Name		Name	Last commit message	Last commit date
Latest commit History 1,294 Commits
.github/workflows		.github/workflows
ci		ci
conda/recipes		conda/recipes
cpp		cpp
doc		doc
docker		docker
python		python
spark/pyspark		spark/pyspark
tests		tests
.clang-format		.clang-format
.clang-tidy		.clang-tidy
.clang-tidy-ignore		.clang-tidy-ignore
.env		.env
.gitignore		.gitignore
.pylintrc		.pylintrc
LICENSE		LICENSE
README.md		README.md
docker-compose.yaml		docker-compose.yaml
zgis.yml		zgis.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

项目定位：

分析引擎：

代码示例：

可视化效果：

近期工作：

v0.1.0

v0.2.0

当前进展：

2020.03.10 达成

欢迎来交流：

github

email

ZILLIZ官方公众号

About

Releases

Packages

Languages

License

Gracieeea/arctern

Folders and files

Latest commit

History

Repository files navigation

项目定位：

分析引擎：

代码示例：

可视化效果：

近期工作：

v0.1.0

v0.2.0

当前进展：

2020.03.10 达成

欢迎来交流：

github

email

ZILLIZ官方公众号

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages