抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

需求背景:部门有大量的数据使用Influxdb进行存储,在这个过程中,我们往往需要对存储的数据做一些指标的统计,比如数据占用的磁盘空间,存储了多少条记录等等,但是部分操作需要大量的Influxdb Sql太费时,于是写了一个简单的程序进行统计

环境要求

  1. Influxdb 1.8 or earlier
  2. Go

指标统计

统计Influxdb指定数据库中有多少条数据记录

  1. 使用Influxdb提供的Go API, 原理其实就是使用select count(*) from 表名统计每个表中数据的数量
    代码
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    package main

    import (
    "encoding/json"
    "flag"
    "fmt"
    "log"
    "time"

    "github.com/sirupsen/logrus"

    client "github.com/influxdata/influxdb1-client/v2"
    )

    var (
    influxdbIp string
    influxdbPort int
    influxdbName string
    )

    // connInflux
    // @Description: 连接influxdb
    // @return client.Client:
    func connInflux() client.Client {
    cli, err := client.NewHTTPClient(client.HTTPConfig{
    Addr: fmt.Sprintf("http://%s:%d", influxdbIp, influxdbPort),
    //Username: "admin",
    //Password: "",
    })
    if err != nil {
    log.Fatal(err)
    }
    return cli
    }

    // queryDB
    // @Description: 从influxdb中执行查询
    // @param cli:
    // @param cmd:
    // @return res:
    // @return err:
    func queryDB(cli client.Client, cmd string, dbName string) (res []client.Result, err error) {
    q := client.Query{
    Command: cmd,
    Database: dbName,
    }
    if response, err := cli.Query(q); err == nil {
    if response.Error() != nil {
    return res, response.Error()
    }
    res = response.Results
    } else {
    return res, err
    }
    return res, nil
    }

    // GetDbDataCount
    // @Description: 获取指定数据库所有表的记录总数
    // @return int: 记录总数
    // @return error:
    func GetDbDataCount(conn client.Client) (int64, error) {
    // 获取数据库里面有哪些数据表
    var err error
    measurementNameList, err := GetMeasurementsCount(conn)

    var count int64
    if err != nil {
    logrus.Error(err.Error())
    return 0, err
    }

    for i := 0; i < len(measurementNameList); i++ {
    // 查询所有的表
    influxdbSQL := fmt.Sprintf("SELECT COUNT(*) FROM %s", measurementNameList[i])
    ret, err := queryDB(conn, influxdbSQL, influxdbName)
    if err != nil {
    log.Fatal(err)
    }

    if len(ret[0].Series) == 0 {
    return 0, nil
    }

    // json.Number 转换为 int64
    tempNum, err := ret[0].Series[0].Values[0][1].(json.Number).Int64()
    if err != nil {
    log.Fatal(err)
    }
    count += tempNum
    }

    return count, nil
    }

    func GetMeasurementsCount(conn client.Client) ([]string, error) {
    influxdbQuerySql := fmt.Sprintf("show measurements")
    ret, err := queryDB(conn, influxdbQuerySql, influxdbName)

    if err != nil {
    logrus.Error(err.Error())
    return []string{}, err
    }

    if len(ret[0].Series) == 0 {
    return []string{}, nil
    }

    var measurementNameList []string
    for i := 0; i < len(ret[0].Series[0].Values); i++ {
    measurementNameList = append(measurementNameList, ret[0].Series[0].Values[i][0].(string))
    }

    return measurementNameList, nil
    }

    // initConfig
    // @Description: 初始化配置
    func initConfig() {
    logrus.Info("start to get config from command args!!!")
    // 获取Influxdb的IP地址
    flag.StringVar(&influxdbIp, "h", "", "Influxdb的IP地址")
    // 获取Influxdb要操作数据库的名字
    flag.StringVar(&influxdbName, "n", "", "Influxdb数据库名字")
    // 获取Influxdb端口
    flag.IntVar(&influxdbPort, "p", 8086, "Influxdb的端口, 默认8086")
    // 解析配置
    flag.Parse()
    logrus.Info("succeed to get config from command args!!!")

    if influxdbIp == "" || influxdbName == "" {
    logrus.Fatal("argument not given, please specify influxdbIp or influxdbName")
    }
    }

    func init() {
    initConfig()
    }

    func main() {
    // 1. 连接influxdb
    conn := connInflux()
    // 2. 查询所有表
    count, err := GetDbDataCount(conn)

    if err != nil {
    log.Fatal(err)
    }

    logrus.Infof("statistical database is completed, %d records are obtained in total", count)
    }

统计数据库占用磁盘空间

  1. 进入influxdb的数据存储目录data,然后执行命令du --max-depth=1 -lh ./统计当前各个目录所占磁盘空间,其中当前的各个目录名表示的就是Influxdb的数据库名

注意事项

  1. 如果数据表中数据量很大,使用select count(*) from 表名统计的时候会造成CPU与磁盘高负载,极有可能会对生产业务机器造成较大影响,在这段时间中,写入数据将会产生很大时延

评论