轻易云平台ETL转换与数据写入技术应用案例

2021-12-06 20:17:23
轻易云集成顾问-黄宏棵

金蝶云星空数据集成到轻易云集成平台：查询公司对应关系表

在本文中，我们将探讨如何通过轻易云数据集成平台，实现金蝶云星空的系统对接，具体以“查询公司对应关系表”这一实际运行方案为例。我们将详细分析API接口调用、数据处理及对接过程中可能遇到的技术问题和解决策略。

为了确保从金蝶云星空获取的数据不漏单，并能快速写入到轻易云集成平台，我们首先利用executeBillQuery接口，从金蝶云星空定时抓取所需的业务数据。该过程需要特别注意分页和限流问题，以保证批量数据的高效获取。

一旦获取的数据成功返回，下一步是批量写入至轻易云集成平台。在此过程中，需要通过专门设计的数据映射机制，处理两者之间可能存在的数据格式差异。此外，借助于轻易云内建的异常处理与错误重试机制，可以有效地应对各种突发错误，提高整体操作的可靠性。

实时监控与日志记录也是不可或缺的一部分，这不仅帮助我们及时掌握每个环节的数据流动情况，还为后续排错和优化提供了重要依据。

总之，通过合理配置和高效调用上述接口API，我们就能够顺利实现从金蝶云星空向轻易云集成平台查询公司对应关系表，从而达到自动化、高效率、低出错率的目标。用友与外部系统接口集成开发

调用金蝶云星空接口executeBillQuery获取并加工数据

在数据集成生命周期的第一步，我们需要调用源系统金蝶云星空接口executeBillQuery来获取并加工数据。本文将详细介绍如何通过轻易云数据集成平台配置元数据，完成这一过程。

配置元数据

首先，我们需要配置元数据，以便正确调用金蝶云星空的API接口。以下是我们使用的元数据配置：

{
  "api": "executeBillQuery",
  "method": "POST",
  "number": "FName",
  "id": "FID",
  "pagination": {
    "pageSize": 500
  },
  "request": [
    {"field": "FID", "label": "实体主键", "type": "string", "value": "FID"},
    {"field": "FDocumentStatus", "label": "数据状态", "type": "string", "value": "FDocumentStatus"},
    {"field": "FName", "label": "名称", "type": "string", "value": "FName"},
    {"field": "FNumber", "label": "编码", "type": "string", "value": "FNumber"},
    {"field": "FDescription", "label": "描述", "type": "string", "value": "FDescription"},
    {"field": "FCreateOrgId", "label": "创建组织", "type": "string", 
![用友与WMS系统接口开发配置](https://pic.qeasy.cloud/S19.png~tplv-syqr462i7n-qeasy.image)
### 使用轻易云数据集成平台进行ETL转换并写入目标平台的技术案例

在数据集成过程中，ETL（Extract, Transform, Load）转换是一个关键步骤。本文将详细探讨如何利用轻易云数据集成平台将已经集成的源平台数据进行ETL转换，并最终写入目标平台。

#### 数据请求与清洗

首先，我们需要从源系统中提取数据。假设我们从一个公司对应关系表中提取数据，这些数据可能包括公司ID、公司名称、行业分类等信息。在这个阶段，数据可能存在不一致、不完整或冗余的问题，因此需要进行清洗。

```python
# 示例代码：从源系统提取并清洗数据
import pandas as pd

# 假设我们从一个API接口获取原始数据
raw_data = fetch_data_from_source_api()

# 清洗数据：去除空值和重复项
cleaned_data = raw_data.dropna().drop_duplicates()

# 打印清洗后的数据
print(cleaned_data)

数据转换

在清洗完毕后，我们需要将这些数据转换为目标平台能够接收的格式。根据元数据配置，目标平台使用的是轻易云集成平台API接口，且需要POST方法提交，并且要求进行ID检查。

# 示例代码：将清洗后的数据转换为目标格式
def transform_data(data):
    transformed_data = []
    for index, row in data.iterrows():
        transformed_entry = {
            "company_id": row["company_id"],
            "company_name": row["company_name"],
            "industry": row["industry"]
        }
        transformed_data.append(transformed_entry)
    return transformed_data

transformed_data = transform_data(cleaned_data)

# 打印转换后的数据
print(transformed_data)

数据写入

最后一步是将转换后的数据写入目标平台。根据元数据配置，我们使用POST方法，并且在写入前进行ID检查，以确保不会重复插入相同的数据。

import requests

# 定义API接口和请求头
api_url = "https://api.qingyiyun.com/write"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer YOUR_ACCESS_TOKEN"
}

def write_to_target_platform(data):
    for entry in data:
        # 进行ID检查，避免重复插入
        if id_check(entry["company_id"]):
            response = requests.post(api_url, json=entry, headers=headers)
            if response.status_code == 200:
                print(f"Successfully wrote entry: {entry}")
            else:
                print(f"Failed to write entry: {entry}, Status Code: {response.status_code}")

def id_check(company_id):
    # 假设有一个函数可以检查ID是否已经存在于目标平台中
    existing_ids = fetch_existing_ids()
    return company_id not in existing_ids

write_to_target_platform(transformed_data)

元数据配置解析

根据提供的元数据配置：

{
    "api": "写入空操作",
    "method": "POST",
    "idCheck": true
}

api字段表示我们使用的是“写入空操作”的API。
method字段明确了我们需要使用POST方法。
idCheck字段指示我们在写入前需要进行ID检查，以避免重复插入。

通过以上步骤，我们实现了从源系统提取、清洗、转换并最终写入目标平台的完整ETL过程。这不仅保证了数据的一致性和完整性，也极大提升了业务流程的效率和透明度。如何开发金蝶云星空API接口