database

`ClickHouseClient` ¶

Bases: object

clickhouse的一些功能，clickhouse写入数据前，需要先创建表格，表格如果不存在则不能写入 clickhouse创建表格使用语句如下

SQL
CREATE TABLE minute_data.minute_data
(   `date` int,
    `num` int,
    `code` VARCHAR(9),
    `open` int,
    `high` int,
    `low` int,
    `close` int,
    `amount` bigint,
    `money` bigint
) ENGINE = ReplacingMergeTree()
    PRIMARY KEY(date,num)
    ORDER BY (date, num);

其中如果主键不指定，则会默认为第一个，主键不能重复，因此会自动保留最后一个。创建表格后，需插入一行数，才算创建成功，否则依然不能写入，插入语句如下

SQL
INSERT INTO minute_data.minute_data (date, code, open, high, low, close, amount, money, num) VALUES
                                        (0,0,0,0,0,0,0,0,0);

Source code in pure_ocean_breeze/data/database.py

Python
class ClickHouseClient(object):
    """clickhouse的一些功能，clickhouse写入数据前，需要先创建表格，表格如果不存在则不能写入
    clickhouse创建表格使用语句如下
    ```sql
    CREATE TABLE minute_data.minute_data
    (   `date` int,
        `num` int,
        `code` VARCHAR(9),
        `open` int,
        `high` int,
        `low` int,
        `close` int,
        `amount` bigint,
        `money` bigint
    ) ENGINE = ReplacingMergeTree()
        PRIMARY KEY(date,num)
        ORDER BY (date, num);
    ```
        其中如果主键不指定，则会默认为第一个，主键不能重复，因此会自动保留最后一个。
        创建表格后，需插入一行数，才算创建成功，否则依然不能写入，插入语句如下
    ```sql
    INSERT INTO minute_data.minute_data (date, code, open, high, low, close, amount, money, num) VALUES
                                            (0,0,0,0,0,0,0,0,0);
    ```
    """

    def __init__(
        self,
        database_name: str,
        database_host: str = "127.0.0.1",
        database_user: str = "default",
        database_password="",
    ):
        self.database_name = database_name
        self.database_host = database_host
        self.database_user = database_user
        self.database_password = database_password
        self.uri = f"clickhouse+native://{database_host}/{database_name}"
        self.engine = create_engine(self.uri)
        # engine = create_engine(self.uri)
        # session = make_session(self.engine)
        # metadata = MetaData(bind=engine)
        #
        # Base = get_declarative_base(metadata=metadata)

    def set_new_engine(self, engine_uri: str) -> None:
        """设置新的地址

        Parameters
        ----------
        engine_uri : str
            新的数据库地址
        """
        self.uri = engine_uri
        self.engine = create_engine(engine_uri)
        logger.success("engine已更改")

    def do_order(self, sql_order: str) -> any:
        """执行任意一句sql语句

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        any
            返回结果
        """
        conn = self.engine.raw_connection()
        cur = conn.cursor()
        return cur.execute(sql_order)

    def get_data_old(self, sql_order: str) -> pd.DataFrame:
        """以pandas.read_sql的方式读取数据

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        pd.DataFrame
            读取的结果
        """
        a = pd.read_sql(sql_order, con=self.engine)
        return a

    @retry(stop=stop_after_attempt(10), wait=wait_fixed(3))
    def get_data(
        self, sql_order: str, only_array: bool = 0
    ) -> Union[pd.DataFrame, np.ndarray]:
        """以sql命令的方式，从数据库中读取数据

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        Union[pd.DataFrame, np.ndarray]
            读取的结果
        """
        conn = self.engine.raw_connection()
        cursor = conn.cursor()
        cursor.execute(sql_order)
        df_data = cursor.fetchall()
        if not only_array:
            columns = [i[0] for i in cursor.description]
            df = pd.DataFrame(df_data, columns=columns)
            return df
        else:
            return np.array(df_data)

    def get_data_old_show_time(self, sql_order: str) -> pd.DataFrame:
        """以pd.read_sql和sql命令的方式，从数据库中读取数据，并告知所用时间

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        pd.DataFrame
            读取的结果
        """
        a = datetime.datetime.now()
        df = self.get_data_old(sql_order)
        b = datetime.datetime.now()
        c = b - a
        l = c.seconds + c.microseconds / 1e6
        l = round(l, 2)
        print(f"共用时{l}秒")
        return df

    def get_data_show_time(self, sql_order: str) -> pd.DataFrame:
        """以cursor和sql命令的方式，从数据库中读取数据，并告知所用时间

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        pd.DataFrame
            读取的结果
        """
        a = datetime.datetime.now()
        df = self.get_data(sql_order)
        b = datetime.datetime.now()
        c = b - a
        l = c.seconds + c.microseconds / 1e6
        l = round(l, 2)
        print(f"共用时{l}秒")
        return df

    def save_data(self, df, sql_order: str, if_exists="append", index=False):
        """存储数据，if_exists可以为append或replace或fail，默认append，index为是否保存df的index"""
        raise IOError(
            """
            请使用pandas自带的df.to_sql()来存储，存储时请注意把小数都转化为整数，例如*100（分钟数据都做了这个处理）
            请勿携带空值，提前做好fillna处理。大于2147000000左右的值，请指定类型为bigint，否则为int即可
            句式如：
            (np.around(min1,2)*100).ffill().astype(int).assign(code='000001.SZ').to_sql('minute_data',engine,if_exists='append',index=False)
            """
        )

    def show_all_xxx_in_tableX(self, key: str, table: str) -> list:
        """查询table这个表中，所有不同的key有哪些

        Parameters
        ----------
        key : str
            键的名字
        table : str
            表的名字

        Returns
        -------
        list
            表中全部的键
        """
        df = self.get_data(f"select distinct({key}) from {self.database_name}.{table}")
        return list(df[key])

    # TODO: 将以下两个函数改为，不需要输入表名，也可以返回日期（以时间更长的股票数据表为准）
    def show_all_codes(self, table_name: str) -> list:
        """返回表中所有股票的代码（常用于分钟数据）

        Parameters
        ----------
        table_name : str
            表名

        Returns
        -------
        list
            表中所有的股票代码
        """
        df = self.get_data(
            f"select distinct(code) from {self.database_name}.{table_name}"
        ).sort_values("code")
        return [i for i in list(df.code) if i != "0"]

    def show_all_dates(self, table_name: str, mul_100=False) -> list:
        """返回分钟数据中所有日期（常用于分钟数据）

        Parameters
        ----------
        table_name : str
            表名
        mul_100 : bool, optional
            返回的日期是否成以100, by default False

        Returns
        -------
        list
            表中所有的日期
        """
        if 'second' in table_name:
            df = self.get_data(f"select distinct(toYYYYMMDD(date)) from {table_name}").sort_values(
                "date"
            )
        else:
            df = self.get_data(f"select distinct(date) from {table_name}").sort_values(
                "date"
            )
        if mul_100:
            return [i for i in list(df.date) if i != 0]
        else:
            return [int(i / 100) for i in list(df.date) if i != 0]

`do_order(sql_order)` ¶

执行任意一句sql语句

Parameters¶

sql_order : str sql命令

Returns¶

any 返回结果

Source code in pure_ocean_breeze/data/database.py

Python
def do_order(self, sql_order: str) -> any:
    """执行任意一句sql语句

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    any
        返回结果
    """
    conn = self.engine.raw_connection()
    cur = conn.cursor()
    return cur.execute(sql_order)

`get_data(sql_order, only_array=0)` ¶

以sql命令的方式，从数据库中读取数据

Parameters¶

sql_order : str sql命令

Returns¶

Union[pd.DataFrame, np.ndarray] 读取的结果

Source code in pure_ocean_breeze/data/database.py

Python
@retry(stop=stop_after_attempt(10), wait=wait_fixed(3))
def get_data(
    self, sql_order: str, only_array: bool = 0
) -> Union[pd.DataFrame, np.ndarray]:
    """以sql命令的方式，从数据库中读取数据

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    Union[pd.DataFrame, np.ndarray]
        读取的结果
    """
    conn = self.engine.raw_connection()
    cursor = conn.cursor()
    cursor.execute(sql_order)
    df_data = cursor.fetchall()
    if not only_array:
        columns = [i[0] for i in cursor.description]
        df = pd.DataFrame(df_data, columns=columns)
        return df
    else:
        return np.array(df_data)

`get_data_old(sql_order)` ¶

以pandas.read_sql的方式读取数据

Parameters¶

sql_order : str sql命令

Returns¶

pd.DataFrame 读取的结果

Source code in pure_ocean_breeze/data/database.py

Python
def get_data_old(self, sql_order: str) -> pd.DataFrame:
    """以pandas.read_sql的方式读取数据

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    pd.DataFrame
        读取的结果
    """
    a = pd.read_sql(sql_order, con=self.engine)
    return a

`get_data_old_show_time(sql_order)` ¶

以pd.read_sql和sql命令的方式，从数据库中读取数据，并告知所用时间

Parameters¶

sql_order : str sql命令

Returns¶

pd.DataFrame 读取的结果

Source code in pure_ocean_breeze/data/database.py

Python
def get_data_old_show_time(self, sql_order: str) -> pd.DataFrame:
    """以pd.read_sql和sql命令的方式，从数据库中读取数据，并告知所用时间

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    pd.DataFrame
        读取的结果
    """
    a = datetime.datetime.now()
    df = self.get_data_old(sql_order)
    b = datetime.datetime.now()
    c = b - a
    l = c.seconds + c.microseconds / 1e6
    l = round(l, 2)
    print(f"共用时{l}秒")
    return df

`get_data_show_time(sql_order)` ¶

以cursor和sql命令的方式，从数据库中读取数据，并告知所用时间

Parameters¶

sql_order : str sql命令

Returns¶

pd.DataFrame 读取的结果

Source code in pure_ocean_breeze/data/database.py

Python
def get_data_show_time(self, sql_order: str) -> pd.DataFrame:
    """以cursor和sql命令的方式，从数据库中读取数据，并告知所用时间

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    pd.DataFrame
        读取的结果
    """
    a = datetime.datetime.now()
    df = self.get_data(sql_order)
    b = datetime.datetime.now()
    c = b - a
    l = c.seconds + c.microseconds / 1e6
    l = round(l, 2)
    print(f"共用时{l}秒")
    return df

`save_data(df, sql_order, if_exists='append', index=False)` ¶

存储数据，if_exists可以为append或replace或fail，默认append，index为是否保存df的index

Source code in pure_ocean_breeze/data/database.py

Python
def save_data(self, df, sql_order: str, if_exists="append", index=False):
    """存储数据，if_exists可以为append或replace或fail，默认append，index为是否保存df的index"""
    raise IOError(
        """
        请使用pandas自带的df.to_sql()来存储，存储时请注意把小数都转化为整数，例如*100（分钟数据都做了这个处理）
        请勿携带空值，提前做好fillna处理。大于2147000000左右的值，请指定类型为bigint，否则为int即可
        句式如：
        (np.around(min1,2)*100).ffill().astype(int).assign(code='000001.SZ').to_sql('minute_data',engine,if_exists='append',index=False)
        """
    )

`set_new_engine(engine_uri)` ¶

设置新的地址

Parameters¶

engine_uri : str 新的数据库地址

Source code in pure_ocean_breeze/data/database.py

Python
def set_new_engine(self, engine_uri: str) -> None:
    """设置新的地址

    Parameters
    ----------
    engine_uri : str
        新的数据库地址
    """
    self.uri = engine_uri
    self.engine = create_engine(engine_uri)
    logger.success("engine已更改")

`show_all_codes(table_name)` ¶

返回表中所有股票的代码（常用于分钟数据）

Parameters¶

table_name : str 表名

Returns¶

list 表中所有的股票代码

Source code in pure_ocean_breeze/data/database.py

Python
def show_all_codes(self, table_name: str) -> list:
    """返回表中所有股票的代码（常用于分钟数据）

    Parameters
    ----------
    table_name : str
        表名

    Returns
    -------
    list
        表中所有的股票代码
    """
    df = self.get_data(
        f"select distinct(code) from {self.database_name}.{table_name}"
    ).sort_values("code")
    return [i for i in list(df.code) if i != "0"]

`show_all_dates(table_name, mul_100=False)` ¶

返回分钟数据中所有日期（常用于分钟数据）

Parameters¶

table_name : str 表名 mul_100 : bool, optional 返回的日期是否成以100, by default False

Returns¶

list 表中所有的日期

Source code in pure_ocean_breeze/data/database.py

Python
def show_all_dates(self, table_name: str, mul_100=False) -> list:
    """返回分钟数据中所有日期（常用于分钟数据）

    Parameters
    ----------
    table_name : str
        表名
    mul_100 : bool, optional
        返回的日期是否成以100, by default False

    Returns
    -------
    list
        表中所有的日期
    """
    if 'second' in table_name:
        df = self.get_data(f"select distinct(toYYYYMMDD(date)) from {table_name}").sort_values(
            "date"
        )
    else:
        df = self.get_data(f"select distinct(date) from {table_name}").sort_values(
            "date"
        )
    if mul_100:
        return [i for i in list(df.date) if i != 0]
    else:
        return [int(i / 100) for i in list(df.date) if i != 0]

`show_all_xxx_in_tableX(key, table)` ¶

查询table这个表中，所有不同的key有哪些

Parameters¶

key : str 键的名字 table : str 表的名字

Returns¶

list 表中全部的键

Source code in pure_ocean_breeze/data/database.py

Python
def show_all_xxx_in_tableX(self, key: str, table: str) -> list:
    """查询table这个表中，所有不同的key有哪些

    Parameters
    ----------
    key : str
        键的名字
    table : str
        表的名字

    Returns
    -------
    list
        表中全部的键
    """
    df = self.get_data(f"select distinct({key}) from {self.database_name}.{table}")
    return list(df[key])

`DriverOfPostgre` ¶

Bases: MetaSQLDriver

能以postgresql和psycopg2驱动连接的数据库

Source code in pure_ocean_breeze/data/database.py

Python
class DriverOfPostgre(MetaSQLDriver):
    """能以postgresql和psycopg2驱动连接的数据库"""

    def __init__(
        self, user: str, password: str, host: str, port: str, database: str
    ) -> None:
        """通过postgre的psycopg2驱动连接数据库

        Parameters
        ----------
        user : str
            用户名
        password : str
            密码
        host : str
            地址
        port : str
            端口
        database : str
            数据库名
        """
        super().__init__(user, password, host, port, database)

    def connect(self):
        conn = pg.connect(
            user=self.user,
            password=self.password,
            host=self.host,
            port=self.port,
            database=self.database,
        )
        return conn

`init(user, password, host, port, database)` ¶

通过postgre的psycopg2驱动连接数据库

Parameters¶

user : str 用户名 password : str 密码 host : str 地址 port : str 端口 database : str 数据库名

Source code in pure_ocean_breeze/data/database.py

Python
def __init__(
    self, user: str, password: str, host: str, port: str, database: str
) -> None:
    """通过postgre的psycopg2驱动连接数据库

    Parameters
    ----------
    user : str
        用户名
    password : str
        密码
    host : str
        地址
    port : str
        端口
    database : str
        数据库名
    """
    super().__init__(user, password, host, port, database)

`MetaSQLDriver` ¶

Bases: object

所有sql类数据库通用的一些功能

Source code in pure_ocean_breeze/data/database.py

Python
class MetaSQLDriver(object):
    """所有sql类数据库通用的一些功能"""

    def __init__(
        self, user: str, password: str, host: str, port: str, database: str
    ) -> None:
        """数据库的基本信息

        Parameters
        ----------
        user : str
            用户名
        password : str
            密码
        host : str
            地址
        port : str
            端口
        database : str
            数据库名
        """
        self.user = user
        self.password = password
        self.host = host
        self.port = port
        self.database = database

    def connect(self):
        ...

    def do_order(self, sql_order: str) -> any:
        """执行任意一句sql语句

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        any
            返回结果
        """
        conn = self.connect()
        cur = conn.cursor()
        return cur.execute(sql_order)

    def add_new_database(self, db_name: str) -> None:
        """添加一个新数据库

        Parameters
        ----------
        db_name : str
            新数据库的名称
        """
        try:
            self.do_order(f"CREATE DATABASE {db_name}")
            logger.success(f"已添加名为{db_name}的数据库")
        except Exception:
            logger.warning(f"已经存在名为{db_name}的数据库，请检查")

    @retry(stop=stop_after_attempt(10))
    def get_data(
        self, sql_order: str, only_array: bool = 0
    ) -> Union[pd.DataFrame, np.ndarray]:
        """以sql命令的方式，从数据库中读取数据

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        Union[pd.DataFrame, np.ndarray]
            读取的结果
        """
        conn = self.connect()
        cursor = conn.cursor()
        cursor.execute(sql_order)
        df_data = cursor.fetchall()
        if not only_array:
            columns = [i[0] for i in cursor.description]
            df = pd.DataFrame(df_data, columns=columns)
            return df
        else:
            return np.array(df_data)

    def get_data_show_time(self, sql_order: str) -> pd.DataFrame:
        """以sql命令的方式，从数据库中读取数据，并告知所用时间

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        pd.DataFrame
            读取的结果
        """
        a = datetime.datetime.now()
        df = self.get_data(sql_order)
        b = datetime.datetime.now()
        c = b - a
        l = c.seconds + c.microseconds / 1e6
        l = round(l, 2)
        print(f"共用时{l}秒")
        return df

    def get_data_alter(self, sql_order: str) -> pd.DataFrame:
        """专门用于应对get_data函数可能出现的特殊情况，例如宽表

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        pd.DataFrame
            读取的结果
        """
        conn = self.connect()
        cursor = conn.cursor()
        cursor.execute(sql_order)
        df_data = cursor.fetchall()
        df = pd.DataFrame(df_data)
        df.columns = list(df.iloc[0, :])
        df = df.iloc[1:, :]
        df.index = list(df.iloc[:, 0])
        df = df.iloc[:, 1:]
        return df

    def get_data_old(self, sql_order: str) -> pd.DataFrame:
        """以pandas.read_sql读取数据

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        pd.DataFrame
            读取的结果
        """
        a = pd.read_sql(sql_order, con=self.engine)
        return a

    def get_data_old_show_time(self, sql_order: str) -> pd.DataFrame:
        """以pd.read_sql和sql命令的方式，从数据库中读取数据，并告知所用时间

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        pd.DataFrame
            读取的结果
        """
        a = datetime.datetime.now()
        df = self.get_data_old(sql_order)
        b = datetime.datetime.now()
        c = b - a
        l = c.seconds + c.microseconds / 1e6
        l = round(l, 2)
        print(f"共用时{l}秒")
        return df

    def show_all_codes(self, table_name: str) -> list:
        """返回表（常用于分钟数据）中所有股票的代码

        Parameters
        ----------
        table_name : str
            表名

        Returns
        -------
        list
            全部股票代码
        """
        df = self.get_data(f"select distinct(code) from {table_name}").sort_values(
            "code"
        )
        return list(df.code)

    def show_all_dates(self, table_name: str) -> list:
        """返回表（常用于分钟数据）中所有日期

        Parameters
        ----------
        table_name : str
            表名

        Returns
        -------
        list
            全部日期
        """
        df = self.get_data(f"select distinct(date) from {table_name}").sort_values(
            "date"
        )
        return list(df.date)

`init(user, password, host, port, database)` ¶

数据库的基本信息

Parameters¶

user : str 用户名 password : str 密码 host : str 地址 port : str 端口 database : str 数据库名

Source code in pure_ocean_breeze/data/database.py

Python
def __init__(
    self, user: str, password: str, host: str, port: str, database: str
) -> None:
    """数据库的基本信息

    Parameters
    ----------
    user : str
        用户名
    password : str
        密码
    host : str
        地址
    port : str
        端口
    database : str
        数据库名
    """
    self.user = user
    self.password = password
    self.host = host
    self.port = port
    self.database = database

`add_new_database(db_name)` ¶

添加一个新数据库

Parameters¶

db_name : str 新数据库的名称

Source code in pure_ocean_breeze/data/database.py

Python
def add_new_database(self, db_name: str) -> None:
    """添加一个新数据库

    Parameters
    ----------
    db_name : str
        新数据库的名称
    """
    try:
        self.do_order(f"CREATE DATABASE {db_name}")
        logger.success(f"已添加名为{db_name}的数据库")
    except Exception:
        logger.warning(f"已经存在名为{db_name}的数据库，请检查")

`do_order(sql_order)` ¶

执行任意一句sql语句

Parameters¶

sql_order : str sql命令

Returns¶

any 返回结果

Source code in pure_ocean_breeze/data/database.py

Python
def do_order(self, sql_order: str) -> any:
    """执行任意一句sql语句

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    any
        返回结果
    """
    conn = self.connect()
    cur = conn.cursor()
    return cur.execute(sql_order)

`get_data(sql_order, only_array=0)` ¶

以sql命令的方式，从数据库中读取数据

Parameters¶

sql_order : str sql命令

Returns¶

Union[pd.DataFrame, np.ndarray] 读取的结果

Source code in pure_ocean_breeze/data/database.py

Python
@retry(stop=stop_after_attempt(10))
def get_data(
    self, sql_order: str, only_array: bool = 0
) -> Union[pd.DataFrame, np.ndarray]:
    """以sql命令的方式，从数据库中读取数据

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    Union[pd.DataFrame, np.ndarray]
        读取的结果
    """
    conn = self.connect()
    cursor = conn.cursor()
    cursor.execute(sql_order)
    df_data = cursor.fetchall()
    if not only_array:
        columns = [i[0] for i in cursor.description]
        df = pd.DataFrame(df_data, columns=columns)
        return df
    else:
        return np.array(df_data)

`get_data_alter(sql_order)` ¶

专门用于应对get_data函数可能出现的特殊情况，例如宽表

Parameters¶

sql_order : str sql命令

Returns¶

pd.DataFrame 读取的结果

Source code in pure_ocean_breeze/data/database.py

Python
def get_data_alter(self, sql_order: str) -> pd.DataFrame:
    """专门用于应对get_data函数可能出现的特殊情况，例如宽表

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    pd.DataFrame
        读取的结果
    """
    conn = self.connect()
    cursor = conn.cursor()
    cursor.execute(sql_order)
    df_data = cursor.fetchall()
    df = pd.DataFrame(df_data)
    df.columns = list(df.iloc[0, :])
    df = df.iloc[1:, :]
    df.index = list(df.iloc[:, 0])
    df = df.iloc[:, 1:]
    return df

`get_data_old(sql_order)` ¶

以pandas.read_sql读取数据

Parameters¶

sql_order : str sql命令

Returns¶

pd.DataFrame 读取的结果

Source code in pure_ocean_breeze/data/database.py

Python
def get_data_old(self, sql_order: str) -> pd.DataFrame:
    """以pandas.read_sql读取数据

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    pd.DataFrame
        读取的结果
    """
    a = pd.read_sql(sql_order, con=self.engine)
    return a

`get_data_old_show_time(sql_order)` ¶

以pd.read_sql和sql命令的方式，从数据库中读取数据，并告知所用时间

Parameters¶

sql_order : str sql命令

Returns¶

pd.DataFrame 读取的结果

Source code in pure_ocean_breeze/data/database.py

Python
def get_data_old_show_time(self, sql_order: str) -> pd.DataFrame:
    """以pd.read_sql和sql命令的方式，从数据库中读取数据，并告知所用时间

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    pd.DataFrame
        读取的结果
    """
    a = datetime.datetime.now()
    df = self.get_data_old(sql_order)
    b = datetime.datetime.now()
    c = b - a
    l = c.seconds + c.microseconds / 1e6
    l = round(l, 2)
    print(f"共用时{l}秒")
    return df

`get_data_show_time(sql_order)` ¶

以sql命令的方式，从数据库中读取数据，并告知所用时间

Parameters¶

sql_order : str sql命令

Returns¶

pd.DataFrame 读取的结果

Source code in pure_ocean_breeze/data/database.py

Python
def get_data_show_time(self, sql_order: str) -> pd.DataFrame:
    """以sql命令的方式，从数据库中读取数据，并告知所用时间

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    pd.DataFrame
        读取的结果
    """
    a = datetime.datetime.now()
    df = self.get_data(sql_order)
    b = datetime.datetime.now()
    c = b - a
    l = c.seconds + c.microseconds / 1e6
    l = round(l, 2)
    print(f"共用时{l}秒")
    return df

`show_all_codes(table_name)` ¶

返回表（常用于分钟数据）中所有股票的代码

Parameters¶

table_name : str 表名

Returns¶

list 全部股票代码

Source code in pure_ocean_breeze/data/database.py

Python
def show_all_codes(self, table_name: str) -> list:
    """返回表（常用于分钟数据）中所有股票的代码

    Parameters
    ----------
    table_name : str
        表名

    Returns
    -------
    list
        全部股票代码
    """
    df = self.get_data(f"select distinct(code) from {table_name}").sort_values(
        "code"
    )
    return list(df.code)

`show_all_dates(table_name)` ¶

返回表（常用于分钟数据）中所有日期

Parameters¶

table_name : str 表名

Returns¶

list 全部日期

Source code in pure_ocean_breeze/data/database.py

Python
def show_all_dates(self, table_name: str) -> list:
    """返回表（常用于分钟数据）中所有日期

    Parameters
    ----------
    table_name : str
        表名

    Returns
    -------
    list
        全部日期
    """
    df = self.get_data(f"select distinct(date) from {table_name}").sort_values(
        "date"
    )
    return list(df.date)

`PostgreSQL` ¶

Bases: DriverOfPostgre

Source code in pure_ocean_breeze/data/database.py

Python
class PostgreSQL(DriverOfPostgre):
    def __init__(
        self,
        database: str = None,
        user: str = "postgres",
        password: str = "Kingwila98",
        host: str = "127.0.0.1",
        port: int = 5433,
    ) -> None:
        """连接postgresql数据库

        Parameters
        ----------
        database : str, optional
            _description_, by default None
        user : str, optional
            _description_, by default 'postgres'
        password : str, optional
            _description_, by default 'Kingwila98'
        host : str, optional
            _description_, by default '127.0.0.1'
        port : int, optional
            _description_, by default 5433
        """
        super().__init__(user, password, host, port, database)
        self.user = user
        self.password = password
        self.host = host
        self.port = port
        self.database = database
        self.engine = create_engine(
            f"postgresql://{user}:{password}@{host}:{port}/{database}"
        )

`init(database=None, user='postgres', password='Kingwila98', host='127.0.0.1', port=5433)` ¶

连接postgresql数据库

Parameters¶

database : str, optional description, by default None user : str, optional description, by default 'postgres' password : str, optional description, by default 'Kingwila98' host : str, optional description, by default '127.0.0.1' port : int, optional description, by default 5433

Source code in pure_ocean_breeze/data/database.py

Python
def __init__(
    self,
    database: str = None,
    user: str = "postgres",
    password: str = "Kingwila98",
    host: str = "127.0.0.1",
    port: int = 5433,
) -> None:
    """连接postgresql数据库

    Parameters
    ----------
    database : str, optional
        _description_, by default None
    user : str, optional
        _description_, by default 'postgres'
    password : str, optional
        _description_, by default 'Kingwila98'
    host : str, optional
        _description_, by default '127.0.0.1'
    port : int, optional
        _description_, by default 5433
    """
    super().__init__(user, password, host, port, database)
    self.user = user
    self.password = password
    self.host = host
    self.port = port
    self.database = database
    self.engine = create_engine(
        f"postgresql://{user}:{password}@{host}:{port}/{database}"
    )

`Questdb` ¶

Bases: DriverOfPostgre

Questdb的写入方式都为追加，因此如果想replace之前的数据，请手动删除表格 Questdb的web console为127.0.0.1:9000，作者已经修改为127.0.0.1:9001

Source code in pure_ocean_breeze/data/database.py

Python
class Questdb(DriverOfPostgre):
    """Questdb的写入方式都为追加，因此如果想replace之前的数据，请手动删除表格
    Questdb的web console为127.0.0.1:9000，作者已经修改为127.0.0.1:9001"""

    def __init__(
        self,
        user: str = "admin",
        password: str = "quest",
        host: str = "127.0.0.1",
        port: str = "8812",
        database: str = "qdb",
        tmp_csv_path: str = "tmp_dataframe_for_questdb.csv",
        web_port: str = "9001",
    ) -> None:
        """通过postgre的psycopg2驱动连接questdb数据库

        Parameters
        ----------
        user : str, optional
            用户名, by default "admin"
        password : str, optional
            密码, by default "quest"
        host : str, optional
            地址, by default "127.0.0.1"
        port : str, optional
            端口, by default "8812"
        database : str, optional
            数据库, by default "qdb"
        tmp_csv_path : str, optional
            通过csv导入数据时，csv文件的暂存位置, by default "/opt/homebrew/var/questdb/copy_path/tmp_dataframe.csv"
        web_port : str, optional
            questdb控制台的端口号，安装questdb软件时默认为9000，本库默认为9001, by default 9001
        """
        super().__init__(user, password, host, port, database)
        self.user = user
        self.password = password
        self.host = host
        self.port = port
        self.database = database
        self.tmp_csv_path = tmp_csv_path
        self.web_port = web_port

    def __addapt_numpy_float64(self, numpy_float64):
        return AsIs(numpy_float64)

    def __addapt_numpy_int64(self, numpy_int64):
        return AsIs(numpy_int64)

    @retry(stop=stop_after_attempt(10), wait=wait_fixed(3))
    def write_via_df(
        self,
        df: pd.DataFrame,
        table_name: str,
        symbols: Union[str, bool, List[int], List[str]] = None,
        tuple_col: Union[str, List[str]] = None,
    ) -> None:
        """通过questdb的python库直接将dataframe写入quested数据库

        Parameters
        ----------
        df : pd.DataFrame
            要写入的dataframe
        table_name : str
            questdb中该表的表名
        symbols : Union[str, bool, List[int], List[str]], optional
            为symbols的那些列的名称, by default None
        tuple_col : Union[str, List[str]], optional
            数据类型为tuple或list的列的名字, by default None
        """
        if tuple_col is None:
            ...
        elif isinstance(tuple_col, str):
            df[tuple_col] = df[tuple_col].apply(str)
        else:
            for t in tuple_col:
                df[t] = df[t].apply(str)
        if symbols is not None:
            with qdbing.Sender(self.host, 9009) as sender:
                sender.dataframe(df, table_name=table_name, symbols=symbols)
        else:
            with qdbing.Sender(self.host, 9009) as sender:
                sender.dataframe(df, table_name=table_name)

    @retry(stop=stop_after_attempt(10), wait=wait_fixed(3))
    def get_data_with_tuple(
        self,
        sql_order: str,
        tuple_col: Union[str, List[str]] = "fac",
        without_timestamp: bool = 1,
    ) -> pd.DataFrame:
        """从questdb数据库中，读取那些值中带有元组或列表的表格

        Parameters
        ----------
        sql_order : str
            读取的sql命令
        tuple_col : Union[str, List[str]], optional
            数值类型为元组或列表的那些列的名称, by default 'fac'
        without_timestamp : bool, optional
            读取时是否删去数据库自动加入的名为`timestamp`的列, by default 1

        Returns
        -------
        pd.DataFrame
            读取到的数据
        """
        data = self.get_data(sql_order)

        def eval_it(x):
            if "," in x.iloc[0]:
                x = x.apply(
                    lambda y: [
                        float(i) if y not in ["nan", " nan", "None"] else np.nan
                        for i in y[1:-1].split(",")
                    ]
                )
            else:
                x = x.astype(float)
            return x

        if isinstance(tuple_col, str):
            data[tuple_col] = eval_it(data[tuple_col])
        else:
            for t in tuple_col:
                data[t] = eval_it(data[t])
        if "timestamp" in list(data.columns):
            if without_timestamp:
                data = data.drop(columns=["timestamp"])
        return data

    def write_via_csv(self, df: pd.DataFrame, table: str, index_id: str = None) -> None:
        """以csv中转的方式，将pd.DataFrame写入Questdb，这一方法的速度约为直接写入的20倍以上，建议使用此方法

        Parameters
        ----------
        df : pd.DataFrame
            要存入的pd.DataFrame
        table : str
            表名
        """
        register_adapter(np.float64, self.__addapt_numpy_float64)
        register_adapter(np.int64, self.__addapt_numpy_int64)
        conn = self.connect()
        # SQL quert to execute
        tmp_df = self.tmp_csv_path + str(np.random.randint(100000000))
        if index_id is None:
            df.to_csv(tmp_df, index=None)
        else:
            df.to_csv(tmp_df, index_label=index_id)
        f = open(tmp_df, "r")
        cursor = conn.cursor()
        try:
            csv = {"data": (table, f)}
            server = f"http://{self.host}:{self.web_port}/imp"
            response = requests.post(server, files=csv)
        except (Exception, pg.DatabaseError) as error:
            print("Error: %s" % error)
            conn.rollback()
            cursor.close()
        f.close()
        cursor.close()
        os.remove(tmp_df)

    def show_all_tables(self) -> pd.DataFrame:
        """获取Questdb中所有的表的名称

        Returns
        -------
        pd.DataFrame
            所有表的名称
        """
        return self.get_data("show tables")

    def show_all_codes(self, table_name: str) -> list:
        """返回表（常用于分钟数据）中所有股票的代码

        Parameters
        ----------
        table_name : str
            表名

        Returns
        -------
        list
            全部股票代码
        """
        df = self.get_data(f"select distinct(code) from {table_name}").sort_values(
            "code"
        )
        return list(df.code)

    def show_all_dates(self, table_name: str) -> list:
        """返回表（常用于分钟数据）中所有日期

        Parameters
        ----------
        table_name : str
            表名

        Returns
        -------
        list
            全部日期
        """
        df = self.get_data(f"select distinct(date) from {table_name}").sort_values(
            "date"
        )
        return list(df.date)

    def copy_all_tables(self):
        """下载某个questdb数据库下所有的表格"""
        homeplace = HomePlace()
        path = homeplace.update_data_file + self.host + "_copy/"
        if not os.path.exists(path):
            os.makedirs(path)
        tables = [
            i
            for i in list(self.show_all_tables().table)
            if i
            not in [
                "sys.column_versions_purge_log",
                "telemetry_config",
                "sys.telemetry_wal",
                "telemetry",
            ]
        ]
        logger.info(f"共{len(tables)}个表，分别为{tables}")
        for table in tables:
            logger.info(f"正在备份{table}表……")
            down = self.get_data(f"select * from {table}")
            down.to_parquet(f"{path}{self.host}_{table}.parquet")
            logger.success(f"{table}表备份完成")
        logger.success("所有表备份完成")

    def upload_all_copies(self):
        """上传之前备份在本地的questdb的所有表格"""
        homeplace = HomePlace()
        path = homeplace.update_data_file + self.host + "_copy/"
        files = os.listdir(path)
        files = [i.split(".parquet")[0] for i in files]
        logger.info(f"共{len(files)}个表，分别为{files}")
        for file in files:
            logger.info(f"正在上传{file}表……")
            self.write_via_df(
                pd.read_parquet(path + file + ".parquet"),
                file.split(self.host + "_")[-1],
            )
            logger.success(f"{file}表上传完成")
        logger.success("所有表上传完成")

`init(user='admin', password='quest', host='127.0.0.1', port='8812', database='qdb', tmp_csv_path='tmp_dataframe_for_questdb.csv', web_port='9001')` ¶

通过postgre的psycopg2驱动连接questdb数据库

Parameters¶

user : str, optional 用户名, by default "admin" password : str, optional 密码, by default "quest" host : str, optional 地址, by default "127.0.0.1" port : str, optional 端口, by default "8812" database : str, optional 数据库, by default "qdb" tmp_csv_path : str, optional 通过csv导入数据时，csv文件的暂存位置, by default "/opt/homebrew/var/questdb/copy_path/tmp_dataframe.csv" web_port : str, optional questdb控制台的端口号，安装questdb软件时默认为9000，本库默认为9001, by default 9001

Source code in pure_ocean_breeze/data/database.py

Python
def __init__(
    self,
    user: str = "admin",
    password: str = "quest",
    host: str = "127.0.0.1",
    port: str = "8812",
    database: str = "qdb",
    tmp_csv_path: str = "tmp_dataframe_for_questdb.csv",
    web_port: str = "9001",
) -> None:
    """通过postgre的psycopg2驱动连接questdb数据库

    Parameters
    ----------
    user : str, optional
        用户名, by default "admin"
    password : str, optional
        密码, by default "quest"
    host : str, optional
        地址, by default "127.0.0.1"
    port : str, optional
        端口, by default "8812"
    database : str, optional
        数据库, by default "qdb"
    tmp_csv_path : str, optional
        通过csv导入数据时，csv文件的暂存位置, by default "/opt/homebrew/var/questdb/copy_path/tmp_dataframe.csv"
    web_port : str, optional
        questdb控制台的端口号，安装questdb软件时默认为9000，本库默认为9001, by default 9001
    """
    super().__init__(user, password, host, port, database)
    self.user = user
    self.password = password
    self.host = host
    self.port = port
    self.database = database
    self.tmp_csv_path = tmp_csv_path
    self.web_port = web_port

`copy_all_tables()` ¶

下载某个questdb数据库下所有的表格

Source code in pure_ocean_breeze/data/database.py

Python
def copy_all_tables(self):
    """下载某个questdb数据库下所有的表格"""
    homeplace = HomePlace()
    path = homeplace.update_data_file + self.host + "_copy/"
    if not os.path.exists(path):
        os.makedirs(path)
    tables = [
        i
        for i in list(self.show_all_tables().table)
        if i
        not in [
            "sys.column_versions_purge_log",
            "telemetry_config",
            "sys.telemetry_wal",
            "telemetry",
        ]
    ]
    logger.info(f"共{len(tables)}个表，分别为{tables}")
    for table in tables:
        logger.info(f"正在备份{table}表……")
        down = self.get_data(f"select * from {table}")
        down.to_parquet(f"{path}{self.host}_{table}.parquet")
        logger.success(f"{table}表备份完成")
    logger.success("所有表备份完成")

`get_data_with_tuple(sql_order, tuple_col='fac', without_timestamp=1)` ¶

从questdb数据库中，读取那些值中带有元组或列表的表格

Parameters¶

sql_order : str 读取的sql命令 tuple_col : Union[str, List[str]], optional 数值类型为元组或列表的那些列的名称, by default 'fac' without_timestamp : bool, optional 读取时是否删去数据库自动加入的名为timestamp的列, by default 1

Returns¶

pd.DataFrame 读取到的数据

Source code in pure_ocean_breeze/data/database.py

Python
@retry(stop=stop_after_attempt(10), wait=wait_fixed(3))
def get_data_with_tuple(
    self,
    sql_order: str,
    tuple_col: Union[str, List[str]] = "fac",
    without_timestamp: bool = 1,
) -> pd.DataFrame:
    """从questdb数据库中，读取那些值中带有元组或列表的表格

    Parameters
    ----------
    sql_order : str
        读取的sql命令
    tuple_col : Union[str, List[str]], optional
        数值类型为元组或列表的那些列的名称, by default 'fac'
    without_timestamp : bool, optional
        读取时是否删去数据库自动加入的名为`timestamp`的列, by default 1

    Returns
    -------
    pd.DataFrame
        读取到的数据
    """
    data = self.get_data(sql_order)

    def eval_it(x):
        if "," in x.iloc[0]:
            x = x.apply(
                lambda y: [
                    float(i) if y not in ["nan", " nan", "None"] else np.nan
                    for i in y[1:-1].split(",")
                ]
            )
        else:
            x = x.astype(float)
        return x

    if isinstance(tuple_col, str):
        data[tuple_col] = eval_it(data[tuple_col])
    else:
        for t in tuple_col:
            data[t] = eval_it(data[t])
    if "timestamp" in list(data.columns):
        if without_timestamp:
            data = data.drop(columns=["timestamp"])
    return data

`show_all_codes(table_name)` ¶

返回表（常用于分钟数据）中所有股票的代码

Parameters¶

table_name : str 表名

Returns¶

list 全部股票代码

Source code in pure_ocean_breeze/data/database.py

Python
def show_all_codes(self, table_name: str) -> list:
    """返回表（常用于分钟数据）中所有股票的代码

    Parameters
    ----------
    table_name : str
        表名

    Returns
    -------
    list
        全部股票代码
    """
    df = self.get_data(f"select distinct(code) from {table_name}").sort_values(
        "code"
    )
    return list(df.code)

`show_all_dates(table_name)` ¶

返回表（常用于分钟数据）中所有日期

Parameters¶

table_name : str 表名

Returns¶

list 全部日期

Source code in pure_ocean_breeze/data/database.py

Python
def show_all_dates(self, table_name: str) -> list:
    """返回表（常用于分钟数据）中所有日期

    Parameters
    ----------
    table_name : str
        表名

    Returns
    -------
    list
        全部日期
    """
    df = self.get_data(f"select distinct(date) from {table_name}").sort_values(
        "date"
    )
    return list(df.date)

`show_all_tables()` ¶

获取Questdb中所有的表的名称

Returns¶

pd.DataFrame 所有表的名称

Source code in pure_ocean_breeze/data/database.py

Python
def show_all_tables(self) -> pd.DataFrame:
    """获取Questdb中所有的表的名称

    Returns
    -------
    pd.DataFrame
        所有表的名称
    """
    return self.get_data("show tables")

`upload_all_copies()` ¶

上传之前备份在本地的questdb的所有表格

Source code in pure_ocean_breeze/data/database.py

Python
def upload_all_copies(self):
    """上传之前备份在本地的questdb的所有表格"""
    homeplace = HomePlace()
    path = homeplace.update_data_file + self.host + "_copy/"
    files = os.listdir(path)
    files = [i.split(".parquet")[0] for i in files]
    logger.info(f"共{len(files)}个表，分别为{files}")
    for file in files:
        logger.info(f"正在上传{file}表……")
        self.write_via_df(
            pd.read_parquet(path + file + ".parquet"),
            file.split(self.host + "_")[-1],
        )
        logger.success(f"{file}表上传完成")
    logger.success("所有表上传完成")

`write_via_csv(df, table, index_id=None)` ¶

以csv中转的方式，将pd.DataFrame写入Questdb，这一方法的速度约为直接写入的20倍以上，建议使用此方法

Parameters¶

df : pd.DataFrame 要存入的pd.DataFrame table : str 表名

Source code in pure_ocean_breeze/data/database.py

Python
def write_via_csv(self, df: pd.DataFrame, table: str, index_id: str = None) -> None:
    """以csv中转的方式，将pd.DataFrame写入Questdb，这一方法的速度约为直接写入的20倍以上，建议使用此方法

    Parameters
    ----------
    df : pd.DataFrame
        要存入的pd.DataFrame
    table : str
        表名
    """
    register_adapter(np.float64, self.__addapt_numpy_float64)
    register_adapter(np.int64, self.__addapt_numpy_int64)
    conn = self.connect()
    # SQL quert to execute
    tmp_df = self.tmp_csv_path + str(np.random.randint(100000000))
    if index_id is None:
        df.to_csv(tmp_df, index=None)
    else:
        df.to_csv(tmp_df, index_label=index_id)
    f = open(tmp_df, "r")
    cursor = conn.cursor()
    try:
        csv = {"data": (table, f)}
        server = f"http://{self.host}:{self.web_port}/imp"
        response = requests.post(server, files=csv)
    except (Exception, pg.DatabaseError) as error:
        print("Error: %s" % error)
        conn.rollback()
        cursor.close()
    f.close()
    cursor.close()
    os.remove(tmp_df)

`write_via_df(df, table_name, symbols=None, tuple_col=None)` ¶

通过questdb的python库直接将dataframe写入quested数据库

Parameters¶

df : pd.DataFrame 要写入的dataframe table_name : str questdb中该表的表名 symbols : Union[str, bool, List[int], List[str]], optional 为symbols的那些列的名称, by default None tuple_col : Union[str, List[str]], optional 数据类型为tuple或list的列的名字, by default None

Source code in pure_ocean_breeze/data/database.py

Python
@retry(stop=stop_after_attempt(10), wait=wait_fixed(3))
def write_via_df(
    self,
    df: pd.DataFrame,
    table_name: str,
    symbols: Union[str, bool, List[int], List[str]] = None,
    tuple_col: Union[str, List[str]] = None,
) -> None:
    """通过questdb的python库直接将dataframe写入quested数据库

    Parameters
    ----------
    df : pd.DataFrame
        要写入的dataframe
    table_name : str
        questdb中该表的表名
    symbols : Union[str, bool, List[int], List[str]], optional
        为symbols的那些列的名称, by default None
    tuple_col : Union[str, List[str]], optional
        数据类型为tuple或list的列的名字, by default None
    """
    if tuple_col is None:
        ...
    elif isinstance(tuple_col, str):
        df[tuple_col] = df[tuple_col].apply(str)
    else:
        for t in tuple_col:
            df[t] = df[t].apply(str)
    if symbols is not None:
        with qdbing.Sender(self.host, 9009) as sender:
            sender.dataframe(df, table_name=table_name, symbols=symbols)
    else:
        with qdbing.Sender(self.host, 9009) as sender:
            sender.dataframe(df, table_name=table_name)

`sqlConfig` ¶

Bases: object

Source code in pure_ocean_breeze/data/database.py

Python
class sqlConfig(object):
    def __init__(
        self,
        db_name: str = None,
        db_user: str = STATES["db_user"],
        db_host: str = STATES["db_host"],
        db_port: int = STATES["db_port"],
        db_password: str = STATES["db_password"],
    ):
        # 初始化数据库连接，使用pymysql模块
        db_info = {
            "user": db_user,
            "password": db_password,
            "host": db_host,
            "port": db_port,
            "database": db_name,
        }
        self.db_name = db_name
        self.db_info = db_info
        self.engine = create_engine(
            "mysql+pymysql://%(user)s:%(password)s@%(host)s:%(port)d/%(database)s?charset=utf8"
            % db_info,
            encoding="utf-8",
        )

    def connect(self, db_name: str = None):
        """以pymysql的方式登录数据库，进行更灵活的操作"""
        if db_name is None:
            mydb = pymysql.connect(
                host=self.db_info["host"],
                user=self.db_info["user"],
                password=self.db_info["password"],
            )
        else:
            mydb = pymysql.connect(
                host=self.db_info["host"],
                user=self.db_info["user"],
                password=self.db_info["password"],
                db=db_name,
            )
        return mydb

    def do_order(self, sql_order: str) -> any:
        """执行任意一句sql语句

        Parameters
        ----------
        sql_order : str
            sql命令

        Returns
        -------
        any
            返回结果
        """
        conn = self.connect()
        cur = conn.cursor()
        return cur.execute(sql_order)

    def add_new_database(self, db_name: str) -> None:
        """添加一个新数据库

        Parameters
        ----------
        db_name : str
            新数据库的名称
        """
        try:
            self.do_order(f"CREATE DATABASE {db_name}")
            logger.success(f"已添加名为{db_name}的数据库")
        except Exception:
            logger.warning(f"已经存在名为{db_name}的数据库，请检查")

    def show_tables_old(self, db_name: str = None, full=True):
        """显示数据库下的所有表"""
        if db_name is None:
            db_name = self.db_name
        mydb = self.connect()
        mycursor = mydb.cursor()
        if full:
            return mycursor.execute(
                f"select * from information_schema.tables where TABLE_SCHEMA={f'{db_name}'}"
            )
        else:
            return mycursor.execute(
                f"select TABLE_NAME from information_schema.tables where TABLE_SCHEMA={f'{db_name}'}"
            )

    def show_tables(self, db_name: str = None, full: bool = True):
        """显示数据库下的所有表"""
        db_info = self.db_info
        db_info["database"] = "information_schema"
        engine = create_engine(
            "mysql+pymysql://%(user)s:%(password)s@%(host)s:%(port)d/%(database)s?charset=utf8"
            % db_info,
            encoding="utf-8",
        )
        if db_name is None:
            db_name = self.db_name
        if full:
            res = self.get_data_sql_order(
                f"select * from information_schema.tables where TABLE_SCHEMA='{db_name}'"
            )
        else:
            res = self.get_data_sql_order(
                f"select TABLE_NAME from information_schema.tables where TABLE_SCHEMA='{db_name}'"
            )
        res.columns = res.columns.str.lower()
        if full:
            return res
        else:
            return list(sorted(res.table_name))

    def show_databases(self, user_only: bool = True, show_number: bool = True) -> list:
        """显示数据库信息"""
        mydb = self.connect()
        mycursor = mydb.cursor()
        res = self.get_data_sql_order(
            "select SCHEMA_NAME from information_schema.schemata"
        )
        res = list(res.SCHEMA_NAME)
        di = {}
        if user_only:
            res = res[4:]
        if show_number:
            for i in res:
                di[i] = mycursor.execute(
                    f"select * from information_schema.tables where TABLE_SCHEMA='{i}'"
                )
            return di
        else:
            return res

    def get_data_sql_order(self, sql_order: str) -> pd.DataFrame:
        conn = self.engine.raw_connection()
        cursor = conn.cursor()
        cursor.execute(sql_order)
        columns = [i[0] for i in cursor.description]
        df_data = cursor.fetchall()
        df = pd.DataFrame(df_data, columns=columns)
        return df

    def get_data_old(
        self,
        table_name: str,
        fields: str = None,
        startdate: int = None,
        enddate: int = None,
        show_time=False,
    ) -> pd.DataFrame:
        """
        从数据库中读取数据，
        table_name为表名，数字开头的加键盘左上角的`符号，形如`000001.SZ`或`20220717`
        fields形如'date,close,open.amount'，不指定则默认读入所有列
        startdate形如20130326，不指定则默认从头读
        enddate形如20220721，不指定则默认读到尾
        """
        if show_time:
            a = datetime.datetime.now()
        if table_name[0].isdigit():
            table_name = f"`{table_name}`"
        if fields is None:
            fields = "*"
        if startdate is None and enddate is None:
            sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name}"
        elif startdate is None and enddate is not None:
            sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date<={enddate}"
        elif startdate is not None and enddate is None:
            sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date>={startdate}"
        else:
            sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date>={startdate} and date<={enddate}"
        self.sql_order = sql_order
        res = pd.read_sql(sql_order, self.engine)
        res.columns = res.columns.str.lower()
        if show_time:
            b = datetime.datetime.now()
            c = b - a
            l = c.seconds + c.microseconds / 1e6
            l = round(l, 2)
            print(f"共用时{l}秒")
        return res

    def get_data(
        self,
        table_name: str,
        fields: str = None,
        startdate: int = None,
        enddate: int = None,
        show_time=False,
    ) -> pd.DataFrame:
        """
        从数据库中读取数据，
        `table_name`为表名，数字开头的加键盘左上角的
        ```sql
        `
        ```
        符号
        形如
        ```sql
        `000001.SZ`
        ```
        或
        ```sql
        `20220717`
        ```
        `fields`形如
        ```sql
        'date,close,open.amount'
        ```
        不指定则默认读入所有列
        `startdate`形如
        ```sql
        `20130326`
        ```
        不指定则默认从头读
        `enddate`形如
        ```sql
        `20220721`
        ```
        不指定则默认读到尾
        """
        if show_time:
            a = datetime.datetime.now()
        if table_name[0].isdigit():
            table_name = f"`{table_name}`"
        if fields is None:
            fields = "*"
        if startdate is None and enddate is None:
            sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name}"
        elif startdate is None and enddate is not None:
            sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date<={enddate}"
        elif startdate is not None and enddate is None:
            sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date>={startdate}"
        else:
            sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date>={startdate} and date<={enddate}"
        self.sql_order = sql_order
        res = self.get_data_sql_order(sql_order)
        res.columns = res.columns.str.lower()
        if show_time:
            b = datetime.datetime.now()
            c = b - a
            l = c.seconds + c.microseconds / 1e6
            l = round(l, 2)
            print(f"共用时{l}秒")
        return res

`add_new_database(db_name)` ¶

添加一个新数据库

Parameters¶

db_name : str 新数据库的名称

Source code in pure_ocean_breeze/data/database.py

Python
def add_new_database(self, db_name: str) -> None:
    """添加一个新数据库

    Parameters
    ----------
    db_name : str
        新数据库的名称
    """
    try:
        self.do_order(f"CREATE DATABASE {db_name}")
        logger.success(f"已添加名为{db_name}的数据库")
    except Exception:
        logger.warning(f"已经存在名为{db_name}的数据库，请检查")

`connect(db_name=None)` ¶

以pymysql的方式登录数据库，进行更灵活的操作

Source code in pure_ocean_breeze/data/database.py

Python
def connect(self, db_name: str = None):
    """以pymysql的方式登录数据库，进行更灵活的操作"""
    if db_name is None:
        mydb = pymysql.connect(
            host=self.db_info["host"],
            user=self.db_info["user"],
            password=self.db_info["password"],
        )
    else:
        mydb = pymysql.connect(
            host=self.db_info["host"],
            user=self.db_info["user"],
            password=self.db_info["password"],
            db=db_name,
        )
    return mydb

`do_order(sql_order)` ¶

执行任意一句sql语句

Parameters¶

sql_order : str sql命令

Returns¶

any 返回结果

Source code in pure_ocean_breeze/data/database.py

Python
def do_order(self, sql_order: str) -> any:
    """执行任意一句sql语句

    Parameters
    ----------
    sql_order : str
        sql命令

    Returns
    -------
    any
        返回结果
    """
    conn = self.connect()
    cur = conn.cursor()
    return cur.execute(sql_order)

`get_data(table_name, fields=None, startdate=None, enddate=None, show_time=False)` ¶

从数据库中读取数据， table_name为表名，数字开头的加键盘左上角的

SQL
`

符号形如

SQL
`000001.SZ`

或

SQL
`20220717`

fields形如

SQL
'date,close,open.amount'

不指定则默认读入所有列 startdate形如

SQL
`20130326`

不指定则默认从头读 enddate形如

SQL
`20220721`

不指定则默认读到尾

Source code in pure_ocean_breeze/data/database.py

Python
def get_data(
    self,
    table_name: str,
    fields: str = None,
    startdate: int = None,
    enddate: int = None,
    show_time=False,
) -> pd.DataFrame:
    """
    从数据库中读取数据，
    `table_name`为表名，数字开头的加键盘左上角的
    ```sql
    `
    ```
    符号
    形如
    ```sql
    `000001.SZ`
    ```
    或
    ```sql
    `20220717`
    ```
    `fields`形如
    ```sql
    'date,close,open.amount'
    ```
    不指定则默认读入所有列
    `startdate`形如
    ```sql
    `20130326`
    ```
    不指定则默认从头读
    `enddate`形如
    ```sql
    `20220721`
    ```
    不指定则默认读到尾
    """
    if show_time:
        a = datetime.datetime.now()
    if table_name[0].isdigit():
        table_name = f"`{table_name}`"
    if fields is None:
        fields = "*"
    if startdate is None and enddate is None:
        sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name}"
    elif startdate is None and enddate is not None:
        sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date<={enddate}"
    elif startdate is not None and enddate is None:
        sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date>={startdate}"
    else:
        sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date>={startdate} and date<={enddate}"
    self.sql_order = sql_order
    res = self.get_data_sql_order(sql_order)
    res.columns = res.columns.str.lower()
    if show_time:
        b = datetime.datetime.now()
        c = b - a
        l = c.seconds + c.microseconds / 1e6
        l = round(l, 2)
        print(f"共用时{l}秒")
    return res

`get_data_old(table_name, fields=None, startdate=None, enddate=None, show_time=False)` ¶

从数据库中读取数据， table_name为表名，数字开头的加键盘左上角的符号，形如000001.SZ或20220717` fields形如'date,close,open.amount'，不指定则默认读入所有列 startdate形如20130326，不指定则默认从头读 enddate形如20220721，不指定则默认读到尾

Source code in pure_ocean_breeze/data/database.py

Python
def get_data_old(
    self,
    table_name: str,
    fields: str = None,
    startdate: int = None,
    enddate: int = None,
    show_time=False,
) -> pd.DataFrame:
    """
    从数据库中读取数据，
    table_name为表名，数字开头的加键盘左上角的`符号，形如`000001.SZ`或`20220717`
    fields形如'date,close,open.amount'，不指定则默认读入所有列
    startdate形如20130326，不指定则默认从头读
    enddate形如20220721，不指定则默认读到尾
    """
    if show_time:
        a = datetime.datetime.now()
    if table_name[0].isdigit():
        table_name = f"`{table_name}`"
    if fields is None:
        fields = "*"
    if startdate is None and enddate is None:
        sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name}"
    elif startdate is None and enddate is not None:
        sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date<={enddate}"
    elif startdate is not None and enddate is None:
        sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date>={startdate}"
    else:
        sql_order = f"SELECT {fields} FROM {self.db_name}.{table_name} where date>={startdate} and date<={enddate}"
    self.sql_order = sql_order
    res = pd.read_sql(sql_order, self.engine)
    res.columns = res.columns.str.lower()
    if show_time:
        b = datetime.datetime.now()
        c = b - a
        l = c.seconds + c.microseconds / 1e6
        l = round(l, 2)
        print(f"共用时{l}秒")
    return res

`show_databases(user_only=True, show_number=True)` ¶

显示数据库信息

Source code in pure_ocean_breeze/data/database.py

Python
def show_databases(self, user_only: bool = True, show_number: bool = True) -> list:
    """显示数据库信息"""
    mydb = self.connect()
    mycursor = mydb.cursor()
    res = self.get_data_sql_order(
        "select SCHEMA_NAME from information_schema.schemata"
    )
    res = list(res.SCHEMA_NAME)
    di = {}
    if user_only:
        res = res[4:]
    if show_number:
        for i in res:
            di[i] = mycursor.execute(
                f"select * from information_schema.tables where TABLE_SCHEMA='{i}'"
            )
        return di
    else:
        return res

`show_tables(db_name=None, full=True)` ¶

显示数据库下的所有表

Source code in pure_ocean_breeze/data/database.py

Python
def show_tables(self, db_name: str = None, full: bool = True):
    """显示数据库下的所有表"""
    db_info = self.db_info
    db_info["database"] = "information_schema"
    engine = create_engine(
        "mysql+pymysql://%(user)s:%(password)s@%(host)s:%(port)d/%(database)s?charset=utf8"
        % db_info,
        encoding="utf-8",
    )
    if db_name is None:
        db_name = self.db_name
    if full:
        res = self.get_data_sql_order(
            f"select * from information_schema.tables where TABLE_SCHEMA='{db_name}'"
        )
    else:
        res = self.get_data_sql_order(
            f"select TABLE_NAME from information_schema.tables where TABLE_SCHEMA='{db_name}'"
        )
    res.columns = res.columns.str.lower()
    if full:
        return res
    else:
        return list(sorted(res.table_name))

`show_tables_old(db_name=None, full=True)` ¶

显示数据库下的所有表

Source code in pure_ocean_breeze/data/database.py

Python
def show_tables_old(self, db_name: str = None, full=True):
    """显示数据库下的所有表"""
    if db_name is None:
        db_name = self.db_name
    mydb = self.connect()
    mycursor = mydb.cursor()
    if full:
        return mycursor.execute(
            f"select * from information_schema.tables where TABLE_SCHEMA={f'{db_name}'}"
        )
    else:
        return mycursor.execute(
            f"select TABLE_NAME from information_schema.tables where TABLE_SCHEMA={f'{db_name}'}"
        )

database

ClickHouseClient ¶

do_order(sql_order) ¶

Parameters¶

Returns¶

get_data(sql_order, only_array=0) ¶

Parameters¶

Returns¶

get_data_old(sql_order) ¶

Parameters¶

Returns¶

get_data_old_show_time(sql_order) ¶

Parameters¶

Returns¶

get_data_show_time(sql_order) ¶

Parameters¶

Returns¶

save_data(df, sql_order, if_exists='append', index=False) ¶

set_new_engine(engine_uri) ¶

Parameters¶

show_all_codes(table_name) ¶

Parameters¶

Returns¶

show_all_dates(table_name, mul_100=False) ¶

Parameters¶

Returns¶

show_all_xxx_in_tableX(key, table) ¶

Parameters¶

Returns¶

DriverOfPostgre ¶

__init__(user, password, host, port, database) ¶

Parameters¶

MetaSQLDriver ¶

__init__(user, password, host, port, database) ¶

Parameters¶

add_new_database(db_name) ¶

Parameters¶

do_order(sql_order) ¶

Parameters¶

Returns¶

get_data(sql_order, only_array=0) ¶

Parameters¶

Returns¶

get_data_alter(sql_order) ¶

Parameters¶

Returns¶

get_data_old(sql_order) ¶

Parameters¶

Returns¶

get_data_old_show_time(sql_order) ¶

Parameters¶

Returns¶

get_data_show_time(sql_order) ¶

Parameters¶

Returns¶

show_all_codes(table_name) ¶

Parameters¶

Returns¶

show_all_dates(table_name) ¶

Parameters¶

Returns¶

PostgreSQL ¶

__init__(database=None, user='postgres', password='Kingwila98', host='127.0.0.1', port=5433) ¶

Parameters¶

Questdb ¶

__init__(user='admin', password='quest', host='127.0.0.1', port='8812', database='qdb', tmp_csv_path='tmp_dataframe_for_questdb.csv', web_port='9001') ¶

Parameters¶

copy_all_tables() ¶

get_data_with_tuple(sql_order, tuple_col='fac', without_timestamp=1) ¶

Parameters¶

Returns¶

show_all_codes(table_name) ¶

Parameters¶

Returns¶

show_all_dates(table_name) ¶

Parameters¶

Returns¶

show_all_tables() ¶

Returns¶

upload_all_copies() ¶

`ClickHouseClient` ¶

`do_order(sql_order)` ¶

`get_data(sql_order, only_array=0)` ¶

`get_data_old(sql_order)` ¶

`get_data_old_show_time(sql_order)` ¶

`get_data_show_time(sql_order)` ¶

`save_data(df, sql_order, if_exists='append', index=False)` ¶

`set_new_engine(engine_uri)` ¶

`show_all_codes(table_name)` ¶

`show_all_dates(table_name, mul_100=False)` ¶

`show_all_xxx_in_tableX(key, table)` ¶

`DriverOfPostgre` ¶

`init(user, password, host, port, database)` ¶

`MetaSQLDriver` ¶

`init(user, password, host, port, database)` ¶

`add_new_database(db_name)` ¶

`do_order(sql_order)` ¶

`get_data(sql_order, only_array=0)` ¶

`get_data_alter(sql_order)` ¶

`get_data_old(sql_order)` ¶

`get_data_old_show_time(sql_order)` ¶

`get_data_show_time(sql_order)` ¶

`show_all_codes(table_name)` ¶

`show_all_dates(table_name)` ¶

`PostgreSQL` ¶

`init(database=None, user='postgres', password='Kingwila98', host='127.0.0.1', port=5433)` ¶

`Questdb` ¶

`init(user='admin', password='quest', host='127.0.0.1', port='8812', database='qdb', tmp_csv_path='tmp_dataframe_for_questdb.csv', web_port='9001')` ¶

`copy_all_tables()` ¶

`get_data_with_tuple(sql_order, tuple_col='fac', without_timestamp=1)` ¶

`show_all_codes(table_name)` ¶

`show_all_dates(table_name)` ¶

`show_all_tables()` ¶

`upload_all_copies()` ¶

`write_via_csv(df, table, index_id=None)` ¶

`write_via_df(df, table_name, symbols=None, tuple_col=None)` ¶

`sqlConfig` ¶

`add_new_database(db_name)` ¶

`connect(db_name=None)` ¶

`do_order(sql_order)` ¶

`get_data(table_name, fields=None, startdate=None, enddate=None, show_time=False)` ¶

`get_data_old(table_name, fields=None, startdate=None, enddate=None, show_time=False)` ¶

`show_databases(user_only=True, show_number=True)` ¶

`show_tables(db_name=None, full=True)` ¶

`show_tables_old(db_name=None, full=True)` ¶