本文档主要介绍 MegaWise Docker 容器镜像的安装和配置等操作,完成后即可连接 MegaWise 进行各类数据操作。文档中涉及的操作主要包含以下部分:
- 安装前提。该部分用于安装和配置 MegaWise Docker 镜像的运行环境,主要包括了 NVIDIA 驱动、Docker 和 NVIDIA container toolkit 的安装。
- MegaWise Docker 安装。该部分包括安装MegaWise,并导入infini示例数据。
- 运行 MegaWise Docker 镜像要求服务器的操作系统为 Ubuntu 16.04 及以上版本。
- 禁用 Nouveau 驱动,并安装 NVIDIA driver 430,确保安装的 NVIDIA driver 包含OpenGL,具体参照 安装 NVIDIA 驱动 430 。如已安装,请使用
nvidia-smi
命令检查是否安装成功。 - 安装 Docker 19.03。如已安装,请使用
docker -v
命令检查。 - 安装NVIDIA container toolkit。
-
禁用 Nouveau 驱动
安装 NVIDIA 驱动之前必须先禁用 Nouveau 驱动。请通过以下命令检查是否已启用 Nouveau 驱动:
$ lsmod | grep nouveau
该命令执行后,如果终端打印了相关信息则说明 Nouveau 驱动已经被启用。如果启用了 Nouveau 驱动,则需执行后续的步骤将其禁用,否则请跳过以下步骤,开始安装 NVIDIA 驱动。
在以下路径创建文件
/etc/modprobe.d/blacklist-nouveau.conf
并在文件中写入如下内容:blacklist nouveau options nouveau modeset=0
执行以下命令并重启系统:
$ sudo update-initramfs -u $ sudo reboot
确认禁用 Nouveau 驱动,执行该命令将不输出任何信息。
$ lsmod | grep nouveau
-
使用 apt 工具安装 NVIDIA 驱动
注意:MegaWise 当前仅支持430及以上版本的 NVIDIA 驱动。安装或更新NVIDIA驱动存在一定风险,有可能导致显示系统崩溃。在操作前,请在NVIDIA官方驱动下载链接检查您的显卡是否适用430及以上版本的 NVIDIA 驱动。
$ sudo add-apt-repository ppa:graphics-drivers/ppa $ sudo apt update $ sudo apt search nvidia-* $ sudo apt install nvidia-430
-
重启系统
$ sudo reboot
-
测试是否安装成功
$ sudo nvidia-smi
如果安装正确,终端打印的内容将包含类似如下信息:
+-----------------------------------------------------------------------------+ | NVIDIA-SMI 430.34 Driver Version: 430.34 CUDA Version: 10.1 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | |===============================+======================+======================| | 0 GeForce GTX 1660 Off | 00000000:01:00.0 On | N/A | | 28% 49C P0 24W / 130W | 2731MiB / 5941MiB | 1% Default | +-------------------------------+----------------------+----------------------+
-
更新源
$ sudo apt-get update
-
使用 curl 工具下载最新版本的 Docker
$ sudo curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - Add Docker to your Apt repository. $ sudo add-apt-repository \ "deb [arch=amd64] https://download.docker.com/linux/ubuntu \ $(lsb_release -cs) \ stable"
如果系统中未安装 curl 工具,则先安装 curl, 然后执行上述命令。
$ sudo apt-get install curl
-
更新 apt-get 仓库。
$ sudo apt-get update
-
安装 Docker 及其相关的命令行接口和 runtime 环境。
$ sudo apt-get install docker-ce docker-ce-cli containerd.io
-
重新执行以下命令验证 Docker 是否安装成功。如果能够打印 Docker 的版本信息,则说明已成功安装Docker。
$ docker -v
-
使用 curl 添加 gpg key。
$ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \ sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
-
更新下载源。
$ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \ sudo tee /etc/apt/sources.list.d/nvidia-docker.list
-
安装 NVIDIA runtime。
$ sudo apt-get update $ sudo apt-get install -y nvidia-container-toolkit
-
重启 Docker daemon
$ sudo systemctl restart docker
-
验证 NVIDIA container toolkit 是否安装成功。
$ docker run --gpus all nvidia/cuda:9.0-base nvidia-smi
如果能够成功打印服务器 GPU 信息,则表示安装成功。
-
请确保当前用户对目录
/tmp
有读写权限 -
下载脚本
install.sh
和data_import.sh
至同一目录,并确保当前用户对两个脚本有可执行权限$ wget https://raw.githubusercontent.com/Infini-Analytics/infini/master/script/data_import.sh \ https://raw.githubusercontent.com/Infini-Analytics/infini/master/script/install_megawise.sh $ chmod a+x *.sh
-
安装MegaWise并导入示例数据
$ ./install_megawise.sh [参数1,必选] [参数2,可选]
参数1:MegaWise安装目录的地址,请确保该目录不存在
参数2:MegaWise镜像id,可选,默认'0.4.0'
示例:./install_megawise.sh /home/$USER/megawise '0.4.0'
该语句所执行的操作:
- 拉取MegaWise docker镜像;
- 下载配置文件和示例数据;
- 启动MegaWise;
- 准备示例数据并导入MegaWise;
- 修改相关配置参数,重启MegaWise服务。
若出现Successfully installed MegaWise and imported test data
表示MegaWise成功安装并导入示例数据。