1. 数据处理节点
专属集成平台
  • 快速开始
    • 集成平台概览
  • 身份与用户管理
    • 用户管理
      • 用户与组织架构管理
    • 角色管理
      • 角色管理配置说明
    • 属性管理
      • 属性管理配置说明
      • IDAAS 扩展物理字段使用说明
    • 上游身份数据集成
      • 通讯录身份集成概述
      • 集成连接器配置指南
        • 通讯录集成-泛微
        • 通讯录集成-飞书
        • 通讯录集成-企业微信
        • 通讯录集成-AD
        • 通讯录集成-睿人事
        • 通讯录集成-北森
        • 通讯录集成-SCIM
        • 通讯录集成-用友EHR
        • 通讯录集成-Azure AD
        • 通讯录集成-致远
        • 通讯录集成-LDAP
        • 通讯录集成-数据库
        • 通讯录集成-钉钉
          • 基础说明
          • 钉钉集成连接器如何配置属性映射
      • 通过连接流实现身份集成
        • 在连接流画布中完成身份集成配置
      • 身份集成常见问题
        • 常见问题 & 排错指南
    • 下游身份数据同步
      • 通讯录同步概述
      • 同步连接器配置指南
        • 通讯录同步-企业微信
        • 通讯录同步-AD
        • 通讯录同步-用友U8C
        • 通讯录同步-钉钉
          • 基础说明
          • 如何配置部门职位扩展字段
      • 通过连接流实现身份同步
        • 使用连接流实现身份下游同步
      • 身份同步常见问题
        • 常见问题 & 排错指南
        • 使用代理网关进行身份同步
  • 认证源管理
    • 认证源基础说明
      • 认证源选型说明
      • 认证源管理概述
    • 认证源配置指南
      • 基础协议配置
        • 认证源-CAS协议
        • 认证源-OIDC协议
        • 认证源-OAuth2协议
      • 三方认证源配置手册
        • 认证源-钉钉
        • 认证源-AD
        • 认证源-飞书
        • 认证源-LDAP
        • 认证源-微信
        • 认证源-微信公众号
        • 认证源-Google Workspace
        • 认证源-AD Azure
        • 认证源-美云智数
        • 认证源-企业微信
  • 应用管理
    • 基础说明
      • 应用管理概述
      • 应用创建与配置
    • 应用单点登录
      • 单点登录概述
      • 单点登录配置
      • 单点登出配置
      • 授权范围配置
      • 自定义集成单点登录配置说明
      • 应用密码代填
      • 应用网关
      • 单点登录配置指南
        • 单点登录-OIDC
        • 单点登录-SAML协议
        • 单点登录-OAuth2
        • 单点登录-CAS协议
        • 单点登录-钉钉SSO
        • 单点登录-分贝通
        • 单点登录-用友NCC
        • 单点登录-宜搭
        • 单点登录-泛微OA
        • 单点登录-致远OA
        • 单点登录-金蝶云星空
        • 单点登录-中国电子云邮箱
        • 单点登录-阿里云控制台(RAM)
        • 单点登录-纷享销客应用
        • 单点登录-纷享销客待办
        • 单点登录-Exchange
        • Exchange-双入口配置指南
    • 应用授权管理
      • 应用授权概述
      • 基于组织架构和用户授权
      • 基于角色授权(RBAC)
      • 基于用户属性授权(ABAC)
      • 用户自主申请应用(OA审批授权)权限
    • 应用分发
      • 企业应用分发
      • ABM应用分发
    • 使用应用调用集成平台 OPENAPI
      • M2M接口授权
      • 接口调用权限配置说明
  • 连接中心
    • 产品概述
      • 什么是 AI 连接流
      • AI 连接流的典型使用场景
    • 基础功能
      • 流程运行日志
      • 功能概览
      • 如何创建 AI 工作流
      • 授权凭证管理
      • 错误处理
    • 节点说明
      • 节点基础类型说明
      • 数据处理节点
        • 文本处理节点
        • 数组处理
        • 数据集合节点
      • 文件处理节点
        • 「Base64 转 URL」动作说明
        • 「PPT分页切割」动作说明
      • 应用节点
        • Teambition
        • 金蝶云 K3Cloud
      • 内置节点
        • 子流程调用
        • 缓存处理
        • 分支节点
        • 循环执行
        • MYSQL 触发动作说明
        • 数字签名
        • Webhook触发
        • 缓存列表处理
        • 条件分支
        • FTP
        • 延时节点
        • 模型子节点
        • MCP SERVER 工具
        • 邮件发送
        • 存储子节点
        • 工具子节点
        • HTTP 请求
        • 变量节点
        • 加解密节点
        • 返回变量
      • 运维管理节点
        • 数据校验节点
      • AI节点
        • 构建你的第一个 AI Agent
        • AI 浏览器操作节点
        • AI Agent节点使用指南
        • AI 消息对话节点 & 组件嵌入
  • 审计日志
    • 管理员行为日志
    • 用户变更日志
    • 接口调用日志
    • 用户行为日志
    • 消息发送日志
  • 权限中心
    • 管理员账号管理
    • 管理员角色管理
  • 品牌设置
    • 登录页设置
      • 登录页面配置
      • 登录页CSS自定义页面样式
      • CSS定制页面内容:样式修改指南及故障排除
    • 短信设置
      • 短信模板配置
      • 短信服务使用及签名修改使用指南
      • 短信服务-自定义连接流配置
      • 阿里云短信网关配置指引
    • 邮件设置
      • 邮件模板配置
      • 通过自定义连接流发送邮件
      • SMTP 配置与测试支持文档
    • 企业消息设置
      • 企业消息配置
      • 企业消息(钉钉_飞书)配置
    • 分发页面设置
      • 分发页面设置
  • 平台设置
    • 功能概述
    • 授权管理
    • 代理网关
    • 授权信息
    • 登录策略配置
      • 弱密码检测功能说明
      • 登录流程配置
      • 自动登录功能配置
    • MFA 配置
      • MFA基础配置
      • 使用连接流自定义 MFA 策略
    • 运维日志
      • 运维日志下载
  • 最佳实践
    • AD-LDAP接入指南
    • 第三方平台应用创建指南
      • 钉钉
        • 钉钉全套集成指南
        • 创建钉钉开放平台应用
      • 飞书
        • 飞书全套集成指南
        • 创建飞书开放平台应用
      • 企微
        • 企业微信全套集成指南
        • 创建企业微信开放平台应用
  • 开放接口
    • 鉴权认证
      • 获取access_token(请求体方式)
      • 获取access_token(Basic认证方式)
    • 用户管理
      • 查询用户
      • 创建用户
      • 根据多个条件过滤并查询用户信息
      • 根据用户帐号获取用户信息
      • 修改用户
      • 启用/禁用用户
      • 删除用户
      • 修改用户密码
    • 组织部门
      • 获取组/部门的列表
      • 创建组/部门
      • 根据组/部门ID获取组/部门的信息
      • 修改组/部门
      • 删除组/部门
      • 根据组/部门ID获取下级组/部门信息
      • 过滤部门信息
    • 角色管理
      • 创建角色
      • 获取单个角色详情
      • 修改角色
      • 删除角色
      • 查询角色列表
      • 根据应用ID和用户ID获取角色列表
      • 查看角色所对应的用户列表
      • 给多个用户添加静态角色
      • 删除用户静态角色
      • 获取用户的角色信息
    • 连接中心
      • Webhook启动连接流
    • 事件通知
      • 连接器事件通知
  1. 数据处理节点

文本处理节点

概述#

高级文本处理节点,支持15种不同的文本操作类型,包括文本分割、格式转换、数据提取、验证等功能。通过丰富的文本处理能力,可以实现复杂的数据清洗、格式转换和内容处理需求。

功能特性#

15种处理类型:涵盖文本分割、格式转换、数据提取、验证等全方位功能
灵活参数配置:支持自定义分隔符、公式变量、正则表达式等
多格式支持:支持HTML、Markdown、JSON、CSV等多种格式转换
智能提取:自动提取数字、URL、关键词等结构化信息
数据验证:内置邮箱、手机号、身份证等格式验证
公式计算:支持基本数学运算和变量替换

支持的操作类型#

1. TEXT_SPLIT - 文本分割#

将文本按指定分隔符分割成多个部分。
参数:
inputText:待分割的文本
fixedSeparator:固定分隔符(space/tab/newline/backslash)
customSeparator:自定义分隔符
输出:Map<String, String> 格式的分割结果

2. EMPTYVALUEREPLACE - 字段空值替换#

将空值或空白文本替换为默认值。
参数:
inputText:输入文本
defaultValue:默认替换值
输出:处理后的字符串

3. FORMULA_CALCULATE - 公式计算#

执行数学公式计算,支持变量替换。
参数:
formula:计算公式(如 "a + b * 2")
variables:变量映射表
输出:计算结果

4. HTMLTOPLAIN_TEXT - HTML转纯文本#

将HTML内容转换为干净的纯文本,支持Markdown格式输出。
参数:
inputText:HTML文本
输出:纯文本内容

5. MARKDOWNTOHTML - Markdown转HTML#

将Markdown文本转换为HTML格式。
参数:
inputText:Markdown文本
输出:HTML格式文本

6. EXTRACT_NUMBERS - 提取数字#

从文本中提取所有阿拉伯数字。
参数:
inputText:输入文本
输出:包含数字值和原始字符串的数组

7. EXTRACT_URLS - 提取URL链接#

从文本中提取所有HTTP/HTTPS链接。
参数:
inputText:输入文本
输出:URL链接数组

8. SEARCHANDCOUNT - 查询并计数#

统计关键词在文本中出现的次数。
参数:
inputText:输入文本
keyword:搜索关键词
输出:出现次数(整数)

9. REMOVEHTMLTAGS - 删除HTML标签#

移除文本中的所有HTML标签。
参数:
inputText:HTML文本
输出:纯文本内容

10. LIMIT_LENGTH - 文本长度限制#

按指定长度截断文本,可添加省略号。
参数:
inputText:输入文本
maxLength:最大长度
addEllipsis:是否添加省略号
输出:截断后的文本

11. CONVERTTONUMBER - 转换为数字#

将文本转换为数字,支持多种转换方式。
参数:
inputText:输入文本
numberConversionType:转换类型(ROUND/CEIL/FLOOR/ADDTHOUSAND/DELTHOUSAND)
decimalPlaces:小数位数
输出:包含数字值和格式化字符串的Map

12. NUMBERTOCHINESE - 数字转中文#

将阿拉伯数字转换为中文数字。
参数:
inputText:数字文本
chineseNumberType:中文类型(LOWERCASE/UPPERCASE)
输出:中文数字字符串

13. VALIDATE_INFO - 校验信息有效性#

验证邮箱、手机号、身份证、URL等格式。
参数:
inputText:待验证文本
validationType:验证类型(EMAIL/PHONE/ID_CARD/URL)
输出:包含验证结果和消息的Map

14. JSONTOCSV - JSON转CSV#

将JSON数组转换为CSV格式。
参数:
inputText:JSON文本
输出:CSV格式字符串

15. CSVTOJSON_LINES - CSV转JSONLines#

将CSV转换为JSON Lines格式。
参数:
inputText:CSV文本
输出:JSON Lines字符串

配置参数#

TextAction 基础参数#

type:操作类型(必需)
inputText:输入文本(大部分操作需要)

类型特定参数#

根据操作类型需要不同的额外参数,详见各操作类型说明。

使用方法#

示例1:文本分割#

{
  "type": "TEXT_SPLIT",
  "inputText": "张三,李四,王五",
  "customSeparator": ","
}
输出:{"key1": "张三", "key2": "李四", "key3": "王五"}

示例2:邮箱验证#

{
  "type": "VALIDATE_INFO",
  "inputText": "user@example.com",
  "validationType": "EMAIL"
}
输出:{"valid": true, "message": "邮箱格式正确"}

示例3:数字格式转换#

{
  "type": "CONVERT_TO_NUMBER",
  "inputText": "1234.567",
  "numberConversionType": "ADD_THOUSAND",
  "decimalPlaces": 2
}
输出:{"number": 1234.57, "formatted": "1,234.57"}

示例4:公式计算#

{
  "type": "FORMULA_CALCULATE",
  "formula": "price * quantity + tax",
  "variables": {
    "price": 10.5,
    "quantity": 3,
    "tax": 2.1
  }
}
输出:35.6

执行逻辑#

参数验证#

1.
检查操作类型是否支持
2.
验证必需参数是否存在
3.
验证参数格式和范围

操作执行#

根据操作类型调用对应的处理方法:
1.
解析输入参数
2.
执行具体的文本处理逻辑
3.
格式化输出结果

错误处理#

参数验证失败抛出异常
处理逻辑异常返回错误信息
记录详细的错误日志

输出结果#

成功输出#

根据操作类型返回不同格式的结果:
字符串:文本处理结果
数字:计数或计算结果
对象:结构化数据
数组:列表数据

错误输出#

{
  "error": "文本处理操作执行失败: 参数不能为空"
}

高级功能#

变量替换#

在公式计算和参数中使用流程变量:
{
  "formula": "${basePrice} * ${quantity} * (1 + ${taxRate})",
  "variables": {
    "basePrice": "${item.price}",
    "quantity": "${order.quantity}",
    "taxRate": "${config.taxRate}"
  }
}

批量处理#

结合循环节点处理多条数据:
Loop (遍历文本列表)
├── TextAction (处理每条文本)
└── VarAction (收集处理结果)

条件处理#

根据文本内容进行条件判断:
TextAction (提取关键词)
├── Condition (检查关键词数量)
│   ├── Branch1: 关键词充足
│   └── Branch2: 需要补充

最佳实践#

1. 选择合适的操作类型#

文本清洗:使用REMOVEHTMLTAGS或HTMLTOPLAIN_TEXT
数据提取:使用EXTRACTNUMBERS或EXTRACTURLS
格式转换:使用JSONTOCSV或MARKDOWNTOHTML

2. 参数配置优化#

使用自定义分隔符提高分割精确度
设置合理的长度限制避免性能问题
根据需要选择中文数字的大小写

3. 错误处理#

检查输入文本是否为空
验证参数格式正确性
处理异常情况的降级方案

4. 性能监控#

监控处理耗时
统计操作成功率
分析内存使用情况

调试和监控#

处理日志#

记录输入参数和操作类型
输出处理结果和耗时
记录异常信息和堆栈

性能指标#

各操作类型的平均处理时间
内存使用峰值
错误率统计

常见问题#

Q: 如何处理包含特殊字符的文本?#

A: 对于包含特殊字符的文本,建议先进行转义或使用自定义分隔符。HTML转纯文本功能会自动处理HTML实体编码。

Q: 公式计算支持哪些运算符?#

A: 支持基本的四则运算(+、-、*、/),运算符优先级正确。变量通过${variable}语法引用。

Q: 数字转换的精度如何保证?#

A: 使用BigDecimal进行高精度计算,支持指定小数位数。ROUND类型使用四舍五入,CEIL向上取整,FLOOR向下取整。

Q: 如何验证自定义格式的数据?#

A: 对于内置验证类型之外的格式,可以使用SEARCHANDCOUNT配合正则表达式,或通过外部脚本实现自定义验证。

Q: 大文件处理有什么限制?#

A: 单次处理的文本大小建议不超过10MB。对于超大文件,建议分块处理或使用流式处理方式。
修改于 2026-05-07 01:44:57
上一页
节点基础类型说明
下一页
数组处理
Built with