DataKit API¶

本文档主要描述 DataKit 开放出来 HTTP API 接口。

API 综述¶

DataKit 目前只支持 HTTP 接口，主要涉及数据写入，数据查询。

通过 API 获取远端 DataKit 版本号¶

有两种方式可获取版本号：

请求 DataKit ping 接口： curl http://ip:9529/v1/ping
在下述每个 API 请求的返回 Header 中，通过 X-DataKit 可获知当前请求的 DataKit 版本

`/v1/write/:category`¶

本 API 用于给 DataKit 上报各类数据（category），参数说明如下：

参数名	类型	是否必选	默认值	说明
`category`	string	Y	无	目前支持 `metric/logging/rum/object/custom_object`
`echo_line_proto`	string	N	无	给任意值（如 `true`）即返回 json 行协议类容，默认不返回
`global_election_tags`	string	N	无	给任意值（如 `true`）即认为追加全局选举类 tag（ Version-1.4.6）
`ignore_global_host_tags`	string	false	无	给任意值（如 `true`）即认为忽略 DataKit 上的全局 tag（ Version-1.4.6）。`ignore_global_tags` 将弃用
`input`	string	N	`datakit`	数据源名称
`loose`	bool	N	false	宽松模式，对于一些不合规的行协议，DataKit 会尝试修复它们（ Version-1.4.11）
`precision`	string	N	`n`	数据精度(支持 `n/u/ms/s/m/h`)
`source`	string	N	无	仅仅针对 logging 支持指定该字段（即 `category` 为 `logging`）。如果不指定 `source`，则上传的日志数据不会执行 Pipeline 切割
`version`	string	N	无	当前采集器的版本号

HTTP body 支持行协议以及 JSON 俩种形式。关于数据结构（不管是行协议形式还是 JSON 形式）的约束，参见这里。

JSON Body 示例¶

为便于行协议处理，所有数据上传 API 均支持 JSON 形式的 body。JSON body 参数说明

参数名	类型	是否必选	默认值	说明
`measurement`	`string`	是	无	指标集名称
`tags`	`map[string]string`	否	无	标签列表
`fields`	`map[string]any-basic-type`	是	无	行协议不能没有指标（field），只能是基础类型，不是是复合类型（如数组、字典等）
`time`	`int64`	否	无	如果不提供，则以 DataKit 的接收时间为准

[
  {
    "measurement": "abc",
    "tags": {
      "t1": "b",
      "t2": "d"
    },
    "fields": {
      "f1": 123,
      "f2": 3.4,
      "f3": "strval"
    },
    "time": 1624550216
  },
  {
    "measurement": "def",
    "tags": {
      "t1": "b",
      "t2": "d"
    },
    "fields": {
      "f1": 123,
      "f2": 3.4,
      "f3": "strval"
    },
    "time": 1624550216
  }
]

注意事项：

如果是 JSON body，需在请求头上标注 Content-Type: application/json，否则当做普通行协议处理
目前 any-basic-type 指通俗意义上的 int/float/bool/string，不考虑不同编程语言差异
关于数值类型的 field，在 JSON 中，由于数值不区分 float/int，导致对于 {"a" : 123} 这段 JSON，目前难以判断其 int 还是 float，基于此，API 对数值处理，统一翻译成 float 类型。这种做法，可能造成存储上的类型冲突（如之前是用行协议 body，后面采用 JSON body）
行协议中，对 int/float 有明显的标识，如 123i 为 int，而 123 为 float
相比行协议的 Body，JSON 形式的 body 性能较差，大概有 7~8 倍的差距。同等数据量前提下，粗略的 Benchmark 对比：

$ go test -bench=.
goos: darwin
goarch: amd64
pkg: gitlab.jiagouyun.com/cloudcare-tools/datakit/http
cpu: Intel(R) Core(TM) i5-8210Y CPU @ 1.60GHz
BenchmarkHandleWriteBody-4     582792  2135 ns/op
BenchmarkHandleJSONWriteBody-4  75606 15693 ns/op  # 明显 json-body 的单次开销更大
PASS
ok      gitlab.jiagouyun.com/cloudcare-tools/datakit/http       4.499s

日志(logging)示例¶

POST /v1/write/logging?precision=n&input=my-sample-logger&ignore_global_tags=123 HTTP/1.1

nginx,tag1=a,tag2=b,filename=a.log f1=1i,f2=1.2,f3="abc",message="real-log-data",status="debug" 1620723870000000000
mysql,tag1=a,tag2=b,filename=b.log f1=1i,f2=1.2,f3="abc",message="other-log-data",status="info" 1620723870000000000
redis,tag1=a,tag2=b,filename=c.log f1=1i,f2=1.2,f3="abc",message="more-log-data",status="error" 1620723870000000000

行协议中的指标集名称(此处的 nginx/mysql/redis) 会作为日志的 source 字段来存储。
原式日志数据存放在 message 字段上

时序数据(metric)示例¶

POST /v1/write/metric?precision=n&input=my-sample-logger&ignore_global_tags=123 HTTP/1.1

cpu,tag1=a,tag2=b f1=1i,f2=1.2,f3="abc" 1620723870000000000
mem,tag1=a,tag2=b f1=1i,f2=1.2,f3="abc" 1620723870000000000
net,tag1=a,tag2=b f1=1i,f2=1.2,f3="abc" 1620723870000000000

对象数据(object)示例¶

POST /v1/write/object?precision=n&input=my-sample-logger&ignore_global_tags=123 HTTP/1.1

redis,name=xxx,tag2=b f1=1i,f2=1.2,f3="abc",message="xxx" 1620723870000000000
rds,name=yyy,tag2=b f1=1i,f2=1.2,f3="abc",message="xxx" 1620723870000000000
slb,name=zzz,tag2=b f1=1i,f2=1.2,f3="abc",message="xxx" 1620723870000000000

Attention

对象数据必须有 name 这个 tag，否则协议报错。

对象数据最好有 message 字段，主要便于做全文搜索。

自定义对象数据示例¶

自定义对象跟对象几乎一致，只是后者是 DataKit 自主采集的，前者是用户通过 datakit API 创建的对象。

POST /v1/write/custom_object?precision=n&input=my-sample-logger&ignore_global_tags=123 HTTP/1.1

redis,name=xxx,tag2=b f1=1i,f2=1.2,f3="abc",message="xxx" 1620723870000000000
rds,name=yyy,tag2=b f1=1i,f2=1.2,f3="abc",message="xxx" 1620723870000000000
slb,name=zzz,tag2=b f1=1i,f2=1.2,f3="abc",message="xxx" 1620723870000000000

Attention

自定义对象数据必须有 name 这个 tag，否则协议报错

自定义对象数据最好有 message 字段，主要便于做全文搜索

RUM¶

参见 RUM 文档

`/v1/ping`¶

检测目标地址是否有 DataKit 运行，可获取 DataKit 启动时间以及版本信息。示例：

GET /v1/ping HTTP/1.1

HTTP/1.1 200 OK

{
    "content":{
        "version":"1.1.6-rc0",
            "uptime":"1.022205003s"
    }
}

`/v1/lasterror`¶

用于上报外部采集器的错误，示例：

POST /v1/lasterror HTTP/1.1
Content-Type: application/json

{
    "input":"redis",
    "err_content":"Cache avalanche"
}

`/v1/workspace`¶

查看工作空间信息及数据配额信息，示例：

GET /v1/workspace HTTP/1.1

HTTP/1.1 200 OK

{
  "content":
  [
    {
      "token": {
        "ws_uuid": "wksp_2dc431d6693711eb8ff97aeee04b54af",
        "bill_state": "normal",
        "ver_type": "pay",
        "token": "tkn_2dc438b6693711eb8ff97aeee04b54af",
        "db_uuid": "ifdb_c0fss9qc8kg4gj9bjjag",
        "status": 0,
        "creator": "",
        "expire_at": -1,
        "create_at": 0,
        "update_at": 0,
        "delete_at": 0
      },
      "data_usage": {
        "data_metric": 96966,
        "data_logging": 3253,
        "data_tracing": 2868,
        "data_rum": 0,
        "is_over_usage": false
      }
    }
  ]
}

`/v1/query/raw`¶

使用 DQL 进行数据查询（只能查询该 DataKit 所在的工作空间的数据），示例：

POST /v1/query/raw HTTP/1.1
Content-Type: application/json

{
    "queries":[
        {
            "query": "cpu:(usage_idle) LIMIT 1",  # dql查询语句（必填）
            "conditions": "",                     # 追加dql查询条件
            "max_duration": "1d",                 # 最大时间范围
            "max_point": 0,                       # 最大点数
            "time_range": [],                     #
            "orderby": [],                        #
            "disable_slimit": true,               # 禁用默认SLimit，当为true时，将不添加默认SLimit值，否则会强制添加SLimit 20
            "disable_multiple_field": true        # 禁用多字段。当为true时，只能查询单个字段的数据（不包括time字段）
        }
    ],
    "echo_explain":true
}

参数说明

名称	说明
`conditions`	额外添加条件表达式，使用 DQL 语法，例如`hostname="cloudserver01" OR system="ubuntu"`。与现有 `query` 中的条件表达式成 `AND` 关系，且会在最外层添加括号避免与其混乱
`disable_multiple_field`	是否禁用多字段。当为 true 时，只能查询单个字段的数据（不包括 time 字段），默认为 `false`
`disable_slimit`	是否禁用默认 SLimit，当为 true 时，将不添加默认 SLimit 值，否则会强制添加 SLimit 20，默认为 `false`
`echo_explain`	是否返回最终执行语句（返回 JSON 数据中的 `raw_query` 字段）
`highlight`	高亮搜索结果
`limit`	限制单个时间线返回的点数，将覆盖 DQL 中存在的 limit
`max_duration`	限制最大查询时间，支持单位 `ns/us/ms/s/m/h/d/w/y` ，例如 `3d` 是 3 天，`2w` 是 2 周，`1y` 是 1 年。默认是 1 年，此参数同样会限制 `time_range` 参数
`max_point`	限制聚合最大点数。在使用聚合函数时，如果聚合密度过小导致点数太多，则会以 `(end_time-start_time)/max_point` 得到新的聚合间隔将其替换
`offset`	一般跟 limit 配置使用，用于结果分页
`orderby`	指定`order by`参数，内容格式为 `map[string]string` 数组，`key` 为要排序的字段名，`value` 只能是排序方式即 `asc` 和 `desc`，例如 `[ { "column01" : "asc" }, { "column02" : "desc" } ]`。此条会替换原查询语句中的 `order by`
`queries`	基础查询模块，包含查询语句和各项附加参数
`query`	DQL 查询语句（DQL 文档）
`search_after`	深度分页，第一次调用分页的时候，传入空列表：`"search_after": []`，成功后服务端会返回一个列表，客户端直接复用这个列表的值再次通过 `search_after` 参数回传给后续的查询即可
`slimit`	限制时间线个数，将覆盖 DQL 中存在的 slimit
`time_range`	限制时间范围，采用时间戳格式，单位为毫秒，数组大小为 2 的 int，如果只有一个元素则认为是起始时间，会覆盖原查询语句中的查询时间区间

返回数据示例：

HTTP/1.1 200 OK
Content-Type: application/json

{
    "content": [
        {
            "series": [
                {
                    "name": "cpu",
                    "columns": [
                        "time",
                        "usage_idle"
                    ],
                    "values": [
                        [
                            1608612960000,
                            99.59595959596913
                        ]
                    ]
                }
            ],
            "cost": "25.093363ms",
            "raw_query": "SELECT \"usage_idle\" FROM \"cpu\" LIMIT 1",
        }
    ]
}

`/v1/object/labels` | `POST`¶

创建或者更新对象的 labels

request body说明

参数	描述	类型
`object_class`	表示 `labels` 所关联的 `object` 类型，如 `HOST`	`string`
`object_name`	表示 `labels` 所关联的 `object` 名称，如 `host-123`	`string`
`key`	表示 `labels` 所关联的 `object` 的具体字段名，如进程名字段 `process_name`	`string`
`value`	表示 `labels` 所关联的 `object` 的具体字段值，如进程名为 `systemsoundserverd`	`void`
`labels`	`labels` 列表，一个 `string` 数组	`[]string`

请求示例：

curl -XPOST "127.0.0.1:9529/v1/object/labels" \
    -H 'Content-Type: application/json'  \
    -d'{
            "object_class": "host_processes",
            "object_name": "ubuntu20-dev_49392",
            "key": "host",
            "value": "ubuntu20-dev",
            "labels": ["l1","l2"]
        }'

成功返回示例:

status_code: 200
{
    "content": {
        "_id": "375370265b0641xxxxxxxxxxxxxxxxxxxxxxxxxx"
    }
}

失败返回示例:

status_code: 500
{
    "errorCode":"some-internal-error"
}

`/v1/object/labels` | `DELETE`¶

删除对象的 labels

request body 说明

参数	描述	类型
`object_class`	表示 `labels` 所关联的 `object` 类型，如 `HOST`	`string`
`object_name`	表示 `labels` 所关联的 `object`名称，如 `host-123`	`string`
`key`	表示 `labels` 所关联的 `object` 的具体字段名，如进程名字段 `process_name`	`string`
`value`	表示 `labels` 所关联的 `object` 的具体字段值，如进程名为 `systemsoundserverd`	`void`

请求示例：

curl -XPOST "127.0.0.1:9529/v1/object/labels"  \
    -H 'Content-Type: application/json'  \
    -d'{
            "object_class": "host_processes",
            "object_name": "ubuntu20-dev_49392",
            "key": "host",
            "value": "ubuntu20-dev"
        }'

成功返回示例:

status_code: 200
{
    "content": {
        "msg": "delete success!"
    }
}

失败返回示例:

status_code: 500
{
    "errorCode": "some-internal-error"
}

`/v1/pipeline/debug` | `POST`¶

提供远程调试 PL 的功能。

请求示例：

POST /v1/pipeline/debug
Content-Type: application/json

{
    "pipeline": base64("pipeline-source-code"),
    "script_name": "<script_name>"
    "category": "<logging[metric, tracing, ...]>", # 日志类别传入日志文本，其他类别需要传入行协议文本
    "data": [ base64("raw-logging-data1"), ... ], # 可以是日志或者行协议
    "encode": "@data 的字符编码",         # 默认是 utf8 编码
    "benchmark": false,                  # 是否开启 benchmark
}

正常返回示例:

HTTP/1.1 200 OK

{
    "content": {
        "cost": "2.3ms",
        "benchmark": BenchmarkResult.String(), # 返回 benchmark 结果
        "error_msg": "",
        "plresults": [ # 由于日志可能是多行的，此处会返回多个切割结果
            {
                "measurement" : "指标集名称，一般是日志 source",
                "tags": { "key": "val", "other-key": "other-val"},
                "fields": { "f1": 1, "f2": "abc", "f3": 1.2 },
                "time": 1644380607, # Unix 时间戳（单位秒）, 前端可将其转成可读日期,
                "time_ns": 421869748, # 余下的纳秒时间，便于精确转换成日期，完整的纳秒时间戳为 1644380607421869748,
                "dropped": false, # 是否在执行 pipeline 中将结果标记为待丢弃
                "error":""
            },
            {  another-result },
            ...
        ]
    }
}

错误返回示例:

HTTP Code: 400

{
    "error_code": "datakit.invalidCategory",
    "message": "invalid category"
}

`/v1/dialtesting/debug` | `POST`¶

提供远程调试 dialtesting 的功能。

请求示例：

POST /v1/dialtesting/debug
Content-Type: application/json

{
    "task_type":"http",//"http","tcp","icmp","websocket"
    "task": {
        "name":"",
        "method":"",
        "url":"",
        "post_url":"",
        "cur_status":"",
        "frequency":"",
        "enable_traceroute":true,//true代表勾选，tcp，icmp才有用
        "success_when_logic":"",
        "SuccessWhen":[]*HTTPSuccess ,
        "tags":map[string]string ,
        "labels":[]string,
        "advance_options":*HTTPAdvanceOption,
    }
}

正常返回示例:

HTTP/1.1 200 OK

{
    "content": {
        "cost": "2.3ms",
        "status": "success",//  success/fail
        "error_msg": "",
        "traceroute":[{"total":3,"failed":0,"loss":0,"avg_cost":0,"min_cost":2,"max_cost":3,"std_cost":33,"items":[{"ip":"127.0.0.1","response_time":33}]}],
    }
}

错误返回示例:

HTTP Code: 400

{
    "error_code": "datakit.invalidClass",
    "message": "invalid class"
}

DataKit 数据结构约束¶

为规范观测云中的数据，现对 DataKit 采集的数据，做如下约束（不管是行协议还是 JSON 形式的数据），并对违反约束的数据将进行相应的处理。

Tag 和 Field 之间的 key 不允许重名，即同一个 key 不能在 Tag 和 Field 中同时出现，否则将丢弃重名的 Field
Tag 或 Field 内部不允许出现同名 key，即同一个 key 不能在 Tag/Field 中出现多次，对于同名 key，将仅保留其中一个
Tag 个数不超过 256 个，超过个数后，将按 key 排序，去掉多余的
Field 个数不超过 1024 个，超过个数后，将按 key 排序，去掉多余的
Tag/Field Key 长度不超过 256 字节，超过长度时，将进行截断处理
Tag Value 长度不超过 1024 字节，超过长度时，将进行截断处理
Field Value 不超过 32M(32x1024x1024) 字节，超过长度时，将进行截断处理
除时序数据外，其它类数据中，均不允许在 Tag/Field key 中出现 . 字符

DataKit API¶

API 综述¶

通过 API 获取远端 DataKit 版本号¶

/v1/write/:category¶

JSON Body 示例¶

日志(logging)示例¶

时序数据(metric)示例¶

对象数据(object)示例¶

自定义对象数据示例¶

RUM¶

/v1/ping¶

/v1/lasterror¶

/v1/workspace¶

/v1/query/raw¶

/v1/object/labels | POST¶

/v1/object/labels | DELETE¶

/v1/pipeline/debug | POST¶

/v1/dialtesting/debug | POST¶

DataKit 数据结构约束¶

延伸阅读¶

`/v1/write/:category`¶

`/v1/ping`¶

`/v1/lasterror`¶

`/v1/workspace`¶

`/v1/query/raw`¶

`/v1/object/labels` | `POST`¶

`/v1/object/labels` | `DELETE`¶

`/v1/pipeline/debug` | `POST`¶

`/v1/dialtesting/debug` | `POST`¶