Boundivore-DataLight

一、简介

DataLight 是一个开源的大数据运维管理平台,用于简化和自动化大数据服务的部署、管理和监控。它提供了一套全面的工具来管理您的大数据生态系统,旨在帮助企业实现简洁、快速地构建 OLAP 与 OLTP 统一的业务平台。用户可以通过 plugin 插件,以插拔式的方式快速集成自己的业务服务或其他大数据组件,从而在平台中进行统一管理。

资源汇总如下:

二、软件架构

这个软件架构通过Master-Worker主从模式实现了高可用、可扩展的分布式计算与大数据处理平台。

arch

三、概念与定义

四、主要功能

下表列出了 DataLight 平台当前一级功能及其受支持状态:

序号一级功能是否已支持
1节点初始化助手
2主从进程维护
3集群管理
4节点初始化
5节点操作与管理
6服务组件装配信息管理
7服务操作与管理
8组件操作与管理
9服务组件预配置项管理
10服务组件配置文件管理
11分布式日志全局管理
12监控管理
13告警管理
14用户管理
15权限管理

五、编译环境

本项目编译需要满足如下需要:

六、部署说明

部署本项目前,请确保你已经准备好了必要的物理资源、操作系统并且理解了本项目的部署流程。

6.1 准备物理资源

确保您有足够的硬件资源来部署和运行本项目。推荐的最小配置包括:

6.2 准备操作系统

本项目目前仅支持(其他系统未测试):

6.3 准备部署资源

clone 本项目,并下载所以来的服务组件包和依赖库库,包括:

6.3.1 创建对应目录

在开始前,首先确认已在主节点中存在上述对应目录。

6.3.2 准备前端页面

前往 DataLight 前端开源项目,按照对应文档执行编译操作,编译后,将编译文件解压后,拷贝至当前源码项目 datalight-services/services-master/public 目录中。

DataLight 前端开源项目:

https://gitee.com/boundivore/boundivore-datalight-web

6.3.3 准备 Master/Worker

将项目克隆后,使用代码编辑器打开后,执行 datalight-services 模块的编译操作(执行 boot-jar, 或从网盘中下载编译好的 jar 包),在 services-master 与 services-worker 项目的 build/libs 目录下,可以分别看到 services-master-[版本号].jar、services-worker-[版本号].jar 两个进程文件,拷贝至 app/ 目录下即可。

6.3.4 准备服务组件插件 Plugins

将项目克隆后,使用代码编辑器打开后,执行 datalight-plugins 模块的编译操作,将该模块下对应服务的插件 jar 包拷贝至指定目录(plugins/[服务名称]/jar)中,例如:/opt/datalight/plugins/[大写服务名称]/jars。

6.3.5 拷贝其他文件目录

在主项目目录中,找到 .documents 文件夹,其下对应内容,拷贝至上述表格中对应的目录中即可。

6.3.6 准备 DLC 服务包

前往如下地址下载 DLC 服务包:

链接:https://pan.baidu.com/s/1342bIcEBDQHdFA35KUTjbQ 
提取码:data 

下载后,解压,将对应服务的 .tar.gz 包放置于对应的 /opt/datalight/plugins/[大写服务名称]/dlc 的目录中即可。

6.4 初始化环境

在启动 Master 主程序之前,需要确认各个准备服役的节点已经完成相关初始化操作,DataLight 平台封装了相关工具,可帮助用户快速一次性初始化所有节点,用户也可手动进行初始化操作。

6.4.1 自动初始化

自动初始化工具位于部署目录下的 assistant 目录,其中涉及到修改的内容如下。

注意:MySQL 5.7 请自行手动安装,自动初始化工具将不包含这部分内容。

下面将对个配置文件进行举例说明。

6.4.2 手动初始化

手动初始化涉及如下内容:

6.5 初始化 DataLight 数据库

上述环境初始化完毕后,需按照如下步骤初始化平台数据库;

6.6 启动 Master 主程序

完成上述初始化操作后,各个节点已经准备好了工作所需的内容,此时可以通过如下方式启动 Master 进程,在主节点中执行:

/opt/datalight/bin/datalight.sh start master 8001

启动成功后,将看到如下日志内容:

No masterIp provided or masterIp is empty. Skipping IP validation.
master starting in 10263...
master started.
/opt/datalight/bin/datalight.sh done.

6.7 登录

启动 Master 主进程成功后,可访问如下页面进行登录:

http://<Master-IP>:8001

注:首次默认账号密码为:admin/admin

页面如下:

登录

七、产品手册

完成上述内容后,请查看 产品手册 继续页面部署操作。

八、计划支持的服务

服务版本是否已支持完成日期
ZOOKEEPER3.8.22023-07
HDFS3.2.42023-07
YARN3.2.42023-08
PROMETHEUS2.46.02023-08
ALERTMANAGER0.26.02023-08
GRAFANA10.0.32023-08
HIVE3.1.32024-04
TEZ0.10.22024-04
HBASE2.5.92024-04
SPARK3.1.32024-05
FLINK3.1.32024-05
HUDI待定
KUBESPHERE3.3.22023-09
SEATUNNEL待定
DOPHINSCHDULER待定
RANGER待定
ATLAS待定
HUE待定
KAFKA2.6.02024-05
ES任意因协议问题,用户自行集成即可
TRINO待定
KYLIN待定
KUDU待定
IMPALA待定
More….

参与开源

如果您对本项目感兴趣,欢迎提供积极的反馈,帮助该项目做的更好。

微信公众号:

QQ 交流群:

开源协议

本项目采用 Apache 2.0 开源协议。有关详细内容,请查看 Apache 2.0 LICENSE

鸣谢

用户

感谢所有贡献者和提交者

贡献者(Contributors)

特别感谢以下人员对本项目的贡献:

提交者(Committers)

特别感谢以下人员为本项目提交代码:

我们非常感谢他们的支持和贡献!

项目

在此特别感谢所有在本项目研发过程中使用到的开源项目或代码库。

没有这些项目的支持,本项目无法顺利进行。

其中特别鸣谢以下开源项目:

推荐

在此,我们推荐一些其他优秀的开源项目,希望对你有帮助:

希望这些推荐的项目能够帮助你在开发过程中提高效率,解决常见问题。