DataCap 是支持用户将服务部署到自主机中。通过本文档用户可以了解如何在自主机中部署 DataCap。
    
        
    
        
            
    
        
    
        
    
        
        
        
               
               
                   
            
                
        
    
        
    
        
            
                
                    
                        
            
        
    
        
            
    
        
    
        
    
        
        
        
               
               
                   
            
                
        
    
        
    
        1.下载最新发布版本
    
        
    
        2.将二进制文件下载到本地后运行以下命令
    
            
            
                
                
                    
            
        
        
    
        
            
            
                
                
                    
            
        
        
    
        
            
    
        
对于软件的首次安装,您需要将
        
        
               
               
                   
            
                
        
    
        
    
        datacap 软件中的所有配置均在 
    
        
            
    
        导入 
    
        
            
            
                
                
                    
            
        
        
    
        
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
        
        
        
               
               
                   
            
                
        
    
            
            
                
                
                    
            
        
        
    
        
        
        
               
               
                   
            
                
        
    
        
    
        
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
        
            
                
            
            
                
        
            
            
            
                
                
                    
            
        
        
    
        
    
        
    
            
            
        
    
        
    
        
    
        
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
        
支持的存储类型详见 https://github.com/devlive-community/datacap/tree/dev/fs
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
        
        
        
               
               
                   
            
                
        
    
        
    
        
            
    
        
        
        
               
               
                   
            
                
        
    
        
    
        
            
    
            
            
                
                
                    
            
        
        
    
        
            
    
        
    
        
    
            
        
            
    
        DataCap服务启动非常简单,执行以下脚本
    
            
            
                
                
                    
            
        
        
    
        
            
    
        停止服务并执行以下脚本
    
            
            
                
                
                    
            
        
        
    
        
            
    
        
        
        
               
               
                   
            
                
        
    
        
        
        
        
            
        系统要求
    
        注意
                    
        
    
        该软件的二进制包基于以下系统进行编译和测试。它尚未在其他版本上进行测试,理论上受支持。
    
        
    
        如果有不支持的系统,请使用源码编译方法主动编译二进制文件。
    
                
            | System | Version | 
|---|---|
| JDK | >=11 | 
| MySQL | >=5.6.x | 
        准备安装包
    
        提示
                    
        
    
        从以下地址下载相应系统的二进制软件包进行安装。如果您需要使用源码安装请前往查看开发者文档模块。
    
                
            bash
            
        
    
            tar -xvzf datacap-<VERSION>-bin.tar.gz- 进入软件根目录
bash
            
        
    
            cd datacap-<VERSION>
        软件配置
    
        对于软件的首次安装,您需要将
schema/datacap.sql
    
         文件中的sql脚本导入MySQL服务器。注意需要导入的脚本根据下载的软件包进行匹配
    
        
    
        注意
                    
        
    
        如果您是通过其他版本升级,请执行 
    
        
            schema//schema.sql 
    
                configure/application.properties
    
         文件中。
    
        
    
        
        基本配置
    
        SQL
    
         脚本后,修改 
    
        configure/application.properties
    
         配置文件以修改MySQL服务器的配置信息
    properties
            
        
    
            server.port=9096
server.address=localhost
spring.jackson.time-zone=GMT+8
spring.jackson.date-format=yyyy-MM-dd HH:mm:ss
datacap.security.secret=DataCapSecretKey
datacap.security.expiration=86400000
datacap.editor.sugs.maxSize=1000- 
        server.port: 用于配置服务在服务器中启动监听的端口,默认为9096
- 
        server.address: 用于配置服务在本地的监听地址,如果需要使用IP+端口方便外部机器访问,请不要设置为localhost,建议设置为0.0.0.0
- 
        spring.jackson.time-zone: 用于配置时区,默认为GMT+8
- 
        spring.jackson.date-format: 用于配置日期格式,默认为yyyy-MM-dd HH:mm:ss
- 
        datacap.security.secret: 用于配置数据安全管理的密钥,默认为DataCapSecretKey
- 
        datacap.security.expiration: 用于配置数据安全管理的过期时间,单位为毫秒,默认为86400000
- 
        datacap.editor.sugs.maxSize: 用于配置数据编辑器的最大行数,默认为1000已经失效不在使用
        Web 服务配置
    
        properties
            
        
    
            spring.mvc.throw-exception-if-no-handler-found=true
spring.resources.add-mappings=false
spring.web.resources.add-mappings=true- 
        spring.mvc.throw-exception-if-no-handler-found: 用于配置是否抛出异常
- 
        spring.resources.add-mappings: 用于配置是否启用静态资源映射
- 
        spring.web.resources.add-mappings: 用于配置是否启用静态资源映射
        数据库配置
    
        注意
                    
        
    
        如果版本 
    
        
            >=8.x
    
        ,请设置 
    
        allowPublicKeyRetrieval=true
    
                properties
            
        
    
            spring.datasource.url=jdbc:mysql://localhost:3306/datacap?useUnicode=true&characterEncoding=UTF-8&zeroDateTimeBehavior=convertToNull&allowMultiQueries=true&useSSL=false&useOldAliasMetadataBehavior=true&jdbcCompliantTruncation=false&allowPublicKeyRetrieval=true
spring.datasource.username=root
spring.datasource.password=12345678- 
        spring.datasource.url: 用于配置数据库连接地址
- 
        spring.datasource.username: 用于配置数据库用户名
- 
        spring.datasource.password: 用于配置数据库密码
提示
                    
        
    
        支持所有 Spring Data 的配置参数
    
                
            
        执行器配置
    
        properties
            
        
    
            datacap.executor.data=
datacap.executor.way=LOCAL
datacap.executor.mode=CLIENT
datacap.executor.engine=SPARK
datacap.executor.startScript=start-seatunnel-spark-connector-v2.sh
datacap.executor.seatunnel.home=/opt/lib/seatunnel- 
        datacap.executor.data: 用于配置执行器的数据缓冲路径
- 
        datacap.executor.way: 用于配置执行器的执行方式,不同的执行器拥有不同的执行方式
- 
        datacap.executor.mode: 用于配置执行器的执行模式,不同的执行器拥有不同的执行模式
- 
        datacap.executor.engine: 用于配置执行器的执行引擎
- 
        datacap.executor.startScript: 用于配置执行器的启动脚本
- 
        datacap.executor.seatunnel.home: 用于配置执行器的 Apache Seatunnel 主目录
        Apache Seatunnel
    
        properties
            
        
    
            datacap.executor.data=
datacap.executor.way=LOCAL
datacap.executor.mode=CLIENT
datacap.executor.engine=SPARK
datacap.executor.startScript=start-seatunnel-spark-connector-v2.sh
datacap.executor.seatunnel.home=/opt/lib/seatunnel
        上传配置
    
        properties
            
        
    
            datacap.config.data=
datacap.cache.data=- 
        datacap.config.data: 用于配置上传配置文件的路径
- 
        datacap.cache.data: 用于配置上传缓存文件的路径
        OpenAi 配置
    
        properties
            
        
    
            datacap.openai.backend=https://api.openai.com
datacap.openai.token=
datacap.openai.model=GPT_35_TURBO_0613
datacap.openai.timeout=30- 
        datacap.openai.backend: 用于配置 OpenAI 的后端地址
- 
        datacap.openai.token: 用于配置 OpenAI 的 token
- 
        datacap.openai.model: 用于配置 OpenAI 的模型
- 
        datacap.openai.timeout: 用于配置 OpenAI 的超时时间,单位为秒
        主系统配置
    
        properties
            
        
    
            datacap.registration.enable=
datacap.captcha.enable=
datacap.cache.maximum=100000
datacap.cache.expiration=5
datacap.audit.sql.print=false- 
        datacap.registration.enable: 用于配置是否开启注册
- 
        datacap.captcha.enable: 用于配置是否开启验证码
- 
        datacap.cache.maximum: 用于配置缓存最大值
- 
        datacap.cache.expiration: 用于配置缓存过期时间,单位为分钟
- 
        datacap.audit.sql.print: 用于配置是否打印 SQL
        流水线配置
    
        properties
            
        
    
            datacap.pipeline.maxRunning=100
datacap.pipeline.maxQueue=200
datacap.pipeline.reset=STOPPED- 
        datacap.pipeline.maxRunning: 用于配置最大运行数
- 
        datacap.pipeline.maxQueue: 用于配置最大队列
- 
        datacap.pipeline.reset: 用于配置重置策略
        存储配置
    
        支持的存储类型详见 https://github.com/devlive-community/datacap/tree/dev/fs
        本地存储配置
    
        properties
            
        
    
            datacap.fs.type=Local
datacap.fs.access=
datacap.fs.secret=
datacap.fs.endpoint=
datacap.fs.bucket=- 
        datacap.fs.type: 用于配置文件系统类型
- 
        datacap.fs.access: 用于配置文件系统访问,该类型可以为空
- 
        datacap.fs.secret: 用于配置文件系统密钥,该类型可以为空
- 
        datacap.fs.endpoint: 用于配置文件系统端点,如果填写后将追加为目录 该类型可以为空
- 
        datacap.fs.bucket: 用于配置文件系统存储桶,该类型可以为空
        阿里云 OSS 配置
    
        properties
            
        
    
            datacap.fs.type=AliOss
datacap.fs.access=
datacap.fs.secret=
datacap.fs.endpoint=
datacap.fs.bucket=- 
        datacap.fs.type: AliOss
        七牛云配置
    
        properties
            
        
    
            datacap.fs.type=Qiniu
datacap.fs.access=
datacap.fs.secret=
datacap.fs.endpoint=
datacap.fs.bucket=- 
        datacap.fs.type: Qiniu
        实验性功能
    
        properties
            
        
    
            datacap.experimental.autoLimit=true
datacap.experimental.data={user.dir}/data
datacap.experimental.avatarPath={username}/avatar/- 
        datacap.experimental.autoLimit: 用于配置是否自动增加 LIMIT
- 
        datacap.experimental.data: 用于配置实验性功能的数据路径
- 
        datacap.experimental.avatarPath: 用于配置实验性功能的头像路径
        日志配置
    
        警告
                    
        
    
        如果需要修改日志配置,只需修改 
    
        
            configure/logback.xml
    
         配置文件即可
    
                
        JVM 配置
    
        警告
                    
        
    
        如果您需要定制化 JVM 配置,只需修改 
    
        
            configure/jvm.conf
    
         配置文件即可
    
                
        插件管理器配置
    
        properties
            
        
    
            plugin.manager.extend.packages=com.fasterxml.jackson- 
        plugin.manager.extend.packages: 用于配置插件扩展包,配置后将优先加载父类加载器中的依赖
        软件启动
    
        
        启动服务前请安装系统需要的各种插件,执行命令 
    
        
        ./bin/install-plugin.sh
    
        ,也可以到服务商店中进行安装。
    
        启动服务
    
        bash
            
        
    
            ./bin/startup.sh
        停止服务
    
        bash
            
        
    
            ./bin/shutdown.sh
        调试服务
    
        提示
                    
        
    
        如果要调试系统,可以使用 
    
        
            ./bin/debug.sh
    
         启动服务,但关闭窗口时它将停止
    
                
        
        贡献者
    
    
