轻松使用轻易云平台实现ETL与MySQL数据写入

2023-04-17 23:45:03
轻易云集成顾问-谢楷斌

旺店通·旗舰版数据集成到MySQL技术案例分享

在本案例中，我们将讨论如何通过轻易云数据集成平台，将旺店通·旗舰版系统的入库单数据高效地集成到MySQL数据库。具体方案名称为“旺店通旗舰版-入库单查询-->BI泰海-入库单表”。

1. 系统对接概述

本次实施主要依赖于两个核心API接口：旺店通·旗舰版的wms.stockin.Base.search和MySQL写入API batchexecute。通过这两个接口，实现从获取、处理到写入的一系列操作。

任务目标:

实现定时可靠抓取旺店通·旗舰版接口数据。
批量、高效地将大量数据快速写入到MySQL数据库。
确保整个过程中的实时监控与异常处理机制，以确保数据不漏单。

2. 数据抓取与转换

首先，通过调用wms.stockin.Base.search API，从旺店通·旗舰版中拉取所需的入库单信息。在此过程中，需要特别注意分页和限流问题，避免由于大批量的数据请求导致服务端响应过慢或被限制访问。因此，设计合理的分页策略以及并发控制是这个环节的重要保障。

随后，对获取的数据进行必要的格式转换。这一步至关重要，因为源系统和目标数据库之间可能存在结构差异。例如，将JSON格式解析为适配MySQL表结构的数据列，这需要结合业务需求编写自定义的数据转换逻辑，从而保证最终映射关系正确无误。

3. 数据写入与监控

为了实现高吞吐量的数据传输，使用 MySQL 的 batchexecute API 对批量处理后的数据进行统一提交。在这一环节，需要关注以下几点：

事务管理: 为了确保数据一致性，采用事务管理机制，即发生错误时可以回滚之前已经执行但未确认的操作。
重试机制: 部署错误重试逻辑，对于暂时性失败（如网络波动）能够自动重新尝试提交，提高整体稳定性和成功率。
性能调优: 针对不同场景调整批处理大小，以平衡内存占用和网络带宽，实现最佳性能输出。

同时，通过集中化监控告警系统，对每一个步骤状态及其整体性能进行实时跟踪，并设置相应阈值以触发告警，一旦出现异常能够第一时间捕捉并处理。这不仅提高了透明度，也极大提升了运维效率。

以上内容构建起完整且高效的数据集成流程，为接下来的详细配置提供坚实基础。如何开发钉钉API接口

调用旺店通·旗舰版接口wms.stockin.Base.search获取并加工数据

在数据集成的生命周期中，调用源系统接口是关键的第一步。本文将详细探讨如何使用轻易云数据集成平台调用旺店通·旗舰版的wms.stockin.Base.search接口，获取并加工入库单数据。

接口配置与调用

首先，我们需要配置接口元数据，以便轻易云平台能够正确地调用该接口并处理返回的数据。根据提供的元数据配置，我们可以看到以下关键参数：

API: wms.stockin.Base.search
请求方法: POST
主要字段: stockin_id（入库单号）、goods_name（商品名称）
请求参数:
- params: 查询参数，包括开始时间、结束时间、单据类型、状态、仓库编号、源单号和入库单号。
- pager: 分页参数，包括分页大小和页号。

请求参数设置

为了确保我们获取到所需的数据，我们需要设置查询参数和分页参数。以下是一个示例请求体：

{
  "params": {
    "start_time": "{{LAST_SYNC_TIME|datetime}}",
    "end_time": "{{CURRENT_TIME|datetime}}",
    "order_type": "1",  // 示例值，实际使用时根据业务需求调整
    "status": "2",      // 示例值，实际使用时根据业务需求调整
    "warehouse_no": "WH001", // 示例值，实际使用时根据业务需求调整
    "src_order_no": "",
    "stockin_no": ""
  },
  "pager": {
    "page_size": "50",
    "page_no": "1"
  }
}

在这个请求体中：

start_time 和 end_time 分别代表查询的时间范围，通常使用上次同步时间和当前时间。
order_type、status、warehouse_no 等字段用于过滤特定条件下的入库单。
pager 用于控制分页，每次请求50条记录，从第一页开始。

数据清洗与转换

一旦成功调用接口并获取到原始数据，我们需要对数据进行清洗和转换，以便后续写入目标系统。在轻易云平台上，可以通过配置自动填充响应（autoFillResponse）和扁平化处理（beatFlat）来简化这一过程。

例如，对于返回的数据结构中的 detail_list 字段，可以通过以下配置将其扁平化：

"autoFillResponse": true,
"beatFlat": ["detail_list"]

这样做的好处是可以将嵌套结构的数据展开为平铺结构，方便后续处理。

数据写入目标系统

经过清洗和转换后的数据，可以通过轻易云平台的标准流程写入目标系统，例如BI泰海的入库单表。在此过程中，需要确保字段映射正确，并且目标系统能够接收和处理这些数据。

实时监控与错误处理

在整个数据集成过程中，实时监控和错误处理是不可或缺的一部分。轻易云平台提供了全面的监控功能，可以实时查看每个环节的数据流动和处理状态。一旦出现错误，可以快速定位并解决问题，确保数据集成过程顺利进行。

通过上述步骤，我们实现了从旺店通·旗舰版获取入库单数据，并经过清洗和转换后写入目标系统。这一过程不仅提高了数据处理效率，还确保了数据的一致性和准确性。金蝶与MES系统接口开发配置

使用轻易云数据集成平台进行ETL转换并写入MySQL

在数据集成生命周期的第二步中，我们需要将已经集成的源平台数据进行ETL转换，转为目标平台 MySQL API 接口所能够接收的格式，最终写入目标平台。本文将通过一个具体的技术案例，详细探讨这一过程中的关键技术点和实现方法。

元数据配置解析

元数据配置是实现数据转换和写入的核心。在本案例中，元数据配置如下：

{
  "api": "batchexecute",
  "effect": "EXECUTE",
  "method": "SQL",
  "idCheck": true,
  "request": [
    {"field":"check_time","label":"审核时间","type":"string","value":"{check_time}"},
    {"field":"created","label":"创建时间","type":"string","value":"{created}"},
    {"field":"flag_id","label":"标记id","type":"string","value":"{flag_id}"},
    {"field":"goods_count","label":"货品数量","type":"string","value":"{goods_count}"},
    {"field":"goods_type_count","label":"货品种类数量","type":"string","value":"{goods_type_count}"},
    {"field":"logistics_id","label":"物流id","type":"string","value":"{logistics_id}"},
    {"field":"logistics_no","label":"物流单号","type":"string","value":"{logistics_no}"},
    {"field":"modified","label":"最后修改时间","type":"string","value":"{modified}"},
    {"field":"note_count","label":"便签数量","type":"string","value":"{note_count}"},
    {"field":"operator_id","label":"经办人","type":"string","value":"{operator_id}"},
    {"field": "remark", "label": "备注", "type": "string", "value": "{remark}"}
  ],
  "otherRequest": [
    {
      "field": "main_sql",
      "label": "主语句",
      "type": "string",
      "describe": "111",
      "value": 
        `REPLACE INTO wms_stockin_base_search 
        (check_time, created, flag_id, goods_count, goods_type_count, logistics_id, logistics_no, modified, note_count, operator_id, remark) 
        VALUES`
    },
    {
      "field": "limit",
      "label": "limit",
      "type": "string",
      "describe": "111",
      "value": "1000"
    }
  ]
}

数据请求与清洗

在进行ETL转换之前，首先要确保从源系统获取的数据是干净且符合目标系统要求的。在本例中，我们从旺店通旗舰版获取入库单查询的数据，这些数据包含了审核时间、创建时间、标记ID、货品数量等字段。我们需要对这些字段进行清洗和标准化处理，以确保它们可以无缝地映射到目标MySQL数据库中的相应字段。

数据转换与写入

字段映射：根据元数据配置中的request部分，将源数据字段映射到目标数据库表中的相应字段。例如，将check_time映射到MySQL表中的check_time字段。

构建SQL语句：利用otherRequest部分提供的主语句模板，构建插入或替换（REPLACE INTO）操作的SQL语句。例如：

REPLACE INTO wms_stockin_base_search 
(check_time, created, flag_id, goods_count, goods_type_count, logistics_id, logistics_no, modified, note_count, operator_id, remark) 
VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)

参数绑定：将清洗后的源数据值绑定到构建好的SQL语句中。这里使用占位符?来代表每个字段值，然后依次绑定对应的数据值。
执行SQL语句：通过轻易云平台提供的API接口，将构建好的SQL语句发送到MySQL数据库执行。API接口配置为：
```
{
 "api": "/mysql/execute",
 "method": "POST",
 ...
}
```
确保每次批量执行的数据条数不超过限制（如1000条），以提高执行效率和可靠性。

实际操作示例

以下是一个实际操作示例，用于展示如何将清洗后的源数据通过ETL过程写入MySQL数据库：

import requests
import json

# 源数据示例
source_data = [
  {
    'check_time': '2023-10-01 12:00:00',
    'created': '2023-10-01 10:00:00',
    'flag_id': '12345',
    'goods_count': '100',
    ...
  },
  ...
]

# 构建请求体
request_body = {
  'main_sql': (
    f"REPLACE INTO wms_stockin_base_search "
    f"(check_time, created, flag_id, goods_count) "
    f"VALUES "
  ),
  'values': []
}

# 填充values部分
for record in source_data:
  values = (
    record['check_time'],
    record['created'],
    record['flag_id'],
    record['goods_count'],
    ...
  )
  request_body['values'].append(values)

# 执行API请求
response = requests.post(
  url='http://example.com/mysql/execute',
  headers={'Content-Type': 'application/json'},
  data=json.dumps(request_body)
)

if response.status_code == 200:
  print("Data successfully written to MySQL.")
else:
  print(f"Failed to write data: {response.text}")

以上代码展示了如何利用Python脚本，通过HTTP POST请求将清洗后的源数据批量写入MySQL数据库。这一过程包括了构建请求体、填充参数、以及调用API接口等步骤。

通过上述技术案例，我们可以看到如何利用轻易云数据集成平台实现复杂的ETL转换，并高效地将处理后的数据写入目标MySQL数据库。这不仅提升了系统间的数据一致性，还极大地提高了业务处理效率。打通金蝶云星空数据接口