目录
- 〇、浅语
- 一、理想情况下的安装过程
- 1.1 安装启动器
- 1.2 启动启动器
- 二、安装问题处理过程记录
- 2.1 Java17问题
- 2.2 在可访问外网的机器上下载 DSS 离线包
- 2.3 安装python3.11
- 2.4 离线安装Dataiku DSS
- 2.5 离线安装Dataiku DSS,指定python路径版
- 三、Dataiku DSS的启动、停止方式
- 3.1 命令行启动
- 3.2 命令行停止
- 3.3 查看状态
- 3.4 创建桌面快捷方式
- 四、后记
- 参考信息
〇、浅语
最近看到一个不错的网站:Towards Data Science,偶尔看到一个博主提到他所用的工具:Dataiku。后来简单了解了一下,这个工具真不错,作为分析工具十分适合。它是数据科学工作室 (DSS) 平台提供简单易用的可视化数据准备方案,以及一套完整的 AutoML 功能。即使不懂代码的用户也能导入和清理数据,并在生产环境中训练和部署机器学习模型——所有操作均可在图形用户界面 (GUI) 环境中完成,无需编写任何代码。
由此,便在电脑上安装适用了一下,整体感觉很不错。下面就是安装过程中遇到的小问题进行了记录。(本来dss就不推荐windows系统,但小菜鸟就熟悉windows,所以霸王硬上弓!)
- Dataiku launcher 下载地址:https://www.dataiku.com/product/get-started/windows/
备注:
- Dataiku DSS 最初并非设计用于在 Windows 系统上原生运行。它目前以实验版本提供,仅供测试使用。
- 适用于 Windows 的 Dataiku Launcher 应用程序可帮助您安装和更新到最新版本的 Dataiku DSS。您只需下载一次即可。
一、理想情况下的安装过程
如果一切正常的情况下,基本上就是下载安装包,一键傻瓜式安装。具体如下1
1.1 安装启动器
- 下载适用于 Windows 的版本
- 双击安装文件安装启动器。2
1.2 启动启动器
- 从开始菜单或 Windows 桌面上的快捷方式启动 Dataiku Launcher 应用程序。
- 首次打开启动器时,它将引导完成 Dataiku DSS 的安装。
- 如果尚未启用长路径支持,启动器会询问是否要在计算机上启用长路径支持(推荐)。
- 安装完成后,Dataiku DSS 会自动在浏览器标签页中打开(支持 Chrome 和 Firefox)。如果关闭了标签页并想重新打开 Dataiku DSS,双击系统托盘(通知区域)中的小鸟图标,或右键单击该图标并选择“打开 Dataiku DSS”,或者打开一个新标签页并访问 http://localhost:11200。
下面是针对按照上述安装时,提示安装失败时,我的处理方式记录。
二、安装问题处理过程记录
如果上节: 一、理想情况下的安装过程 安装失败。那大概率需要采用离线安装包进行安装了。
总体目标是:
在可联网机器下载 DSS 安装包 → 拷贝到内网机器 → 放入 Launcher 本地 kits 目录 → 让 Launcher 自动识别并完成安装。
据此,遇到的需要解决的几个问题如下。
2.1 Java17问题
默认的Launcher 在自动从 GitHub 下载OpenJDK 17,可能会因为下载时被防火墙 / 代理 / 不稳定网络中断 + 安装残留锁定进程 等问题被阻断。即使 DSS 包已经下载成功,只要 Java 安装失败,整个安装就会回滚。
备注:目前
针对该问题处理方案如下:
- 先彻底关闭残留的 Dataiku Launcher 进程
- 打开 任务管理器(Ctrl + Shift + Esc)
- 在“进程”里结束以下所有相关进程:
- Dataiku Launcher
- Dataiku
- node.exe(如果命令行显示路径指向 Dataiku)
- 确认没有残留进程后再继续。
如果任务管理器无法结束,可直接重启电脑一次。
- 清理失败的残留安装目录
- 删除以下目录(如果存在):
C:\Users\用户名\AppData\Local\Dataiku
C:\Users\用户名\AppData\Local\Programs\Dataiku Launcher\
- 注意:这是本地安装缓存目录,删除不会影响系统其他软件。
- 删除完成后,确认这两个目录不存在。
- 手动安装 Java 17,再让 Dataiku 识别
手动下载安装 Java 17:在浏览器中打开Adoptium Temurin JDK 17 官方页面: https://adoptium.net/temurin/releases/?version=17下载:Windows x64 MSI 或 ZIP 均可(推荐 MSI 安装版).
安装完成后,确认。打开 CMD,执行下列命令,能看到 Java 17 版本信息。
java -version- 设置 JAVA_HOME(如果安装器未自动设置)
假设安装路径类似:
C:\Program Files\Eclipse Adoptium\jdk-17.x.x\设置系统环境变量:新建变量名:JAVA_HOME,变量值:上面的 JDK 路径
在 Path 中追加:
%JAVA_HOME%\bin重新打开 CMD 验证:
java -version2.2 在可访问外网的机器上下载 DSS 离线包
- 打开官方下载页面
- 访问:https://cdn.downloads.dataiku.com/public/dss/14.3.1/dataiku-dss-14.3.1-win.tar.gz 进行Dataiku DSS安装包下载。
- 拷贝安装包文件到目标机器的指定目录下
- 目标机器创建目录(如果不存在):
C:\Users\用户名\AppData\Local\Dataiku\DataScienceStudio\kits- 拷贝安装包到 上面的kits 目录下
- 手动解压 DSS 安装包
- 右键:dataiku-dss-14.3.1-win.tar.gz → 解压到当前文件夹。
- 最终目录结构应为:
kits ├── dataiku-dss-14.3.1-win │ ├── bin │ ├── installer │ ├── lib │ └──... └── dataiku-dss-14.3.1-win.tar.gz (可保留或删除)⚠️ 非常关键:必须解压到 kits 目录本身,而不是子目录里套一层。
2.3 安装python3.11
虽然 DSS 包内带有 Python 目录,但 Windows 离线安装脚本仍然要求系统层可识别 Python 3.11 可执行文件(在 PATH 或显式指定)。
⚠️ 手动指定 Python 可执行路径给安装器(如果你已经有 Python 3.11),且目前用的Dataiku必须使用3.11版本。
- 下载 Python 3.11 安装包
- 根据下列路径,在页面下方选择下载:Windows installer (64-bit)
https://www.python.org/downloads/release/python-3119/- 拷贝到目标机器并安装
- 在目标机器上右键安装包 → 以管理员身份运行
- 第一个界面一定要勾选:Add Python 3.11 to PATH(这是为了快捷,不然后续也可手动指定)
- 点击:Install Now
- 安装完成后关闭窗口。
- 验证 Python 是否生效,打开新的 CMD 或 PowerShell:
python --version- 必须显示:Python 3.11.x(如果显示找不到命令,说明 PATH 没配置成功,需要手动修复。)
2.4 离线安装Dataiku DSS
- 以管理员身份打开 CMD
- 进入 DSS 安装目录。
cdC:\Users\用户名\AppData\Local\Dataiku\DataScienceStudio\kits\dataiku-dss-14.3.1-win- 选择一个 DSS 数据目录(DATADIR)
- 该目录是 DSS 存放:项目数据、配置、日志、模型文件 的工作目录,不能放在 kits 目录里。这里以下面路径为例:
C:\Users\用户名\DataikuDSS⚠️ 后续按照中需要指定和使用该目录。
- 安装Dataiku DSS
- 执行命令
powershell -ExecutionPolicy Bypass -File installer.ps1 -d C:\Users\用户名\DataikuDSS -p100002.5 离线安装Dataiku DSS,指定python路径版
如果考虑到多python环境管理的问题,也可以手动指定dss依赖的python3.11路径。
- 假如python3.11文件路径如下:
C:\Python311\python.exe- 选择一个 DSS 数据目录(DATADIR)
- 该目录是 DSS 存放:项目数据、配置、日志、模型文件 的工作目录,不能放在 kits 目录里。这里以下面路径为例:
C:\Users\用户名\DataikuDSS⚠️ 后续按照中需要指定和使用该目录。
- 使用参数指定python路径,具体命令示例如下
powershell -ExecutionPolicy Bypass -File installer.ps1 -d C:\Users\用户名\DataikuDSS -p10000-py C:\Python311\python.exe⚠️ 前提是下面命令必须返回 Python 3.11.x。
C:\Python311\python.exe --version三、Dataiku DSS的启动、停止方式
3.1 命令行启动
- 安装完成后,你可以通过以下命令启动 DSS:
C:/Users/用户名/DataikuDSS/bin/dss.cmd start- 上面命令运行起来后,浏览器输入:http://localhost:10000/,大概就可以看到如下界面,大功告成。
3.2 命令行停止
C:/Users/用户名/DataikuDSS/bin/dss.cmd stop3.3 查看状态
C:/Users/用户名/DataikuDSS/bin/dss.cmd status📝以上三步可作为日常操作流程。
3.4 创建桌面快捷方式
如果希望通过双击图标启动 DSS,可以手动创建快捷方式:
- 在桌面右键 → 新建 → 快捷方式。
- 目标路径填:
C:\Windows\System32\cmd.exe /k"C:\Users\用户名\DataikuDSS\bin\dss.cmd start"- 给快捷方式命名,比如 Dataiku DSS。
- 以后双击就会打开命令窗口并启动 DSS。
四、后记
还是要保持阅读最新的一些高质量博文,包括国内、国外。在这个匆匆忙忙的世界,信息技术日新月异,保持内核的同时,也需要向外生长。
参考信息
Dataiku官网 ↩︎
在 Windows 上安装说明文档 ↩︎