当前位置: 首页 > news >正文

中国尊设计公司电脑清理优化大师

中国尊设计公司,电脑清理优化大师,海拉尔做自己的网站,网站平台构建SQL On Pandas最佳实践 1、PandaSQL1.1、PandaSQL简介1.2、Pandas与PandaSQL解决方案对比1.3、PandaSQL支持的窗口函数1.4、PandaSQL综合使用案例2、DuckDB2.1、DuckDB简介2.2、SQL操作(SQL On Pandas)2.3、逻辑SQL(DSL on Pandas)2.4、DuckDB on Apache Arrow2.5、DuckDB …

SQL On Pandas最佳实践

    • 1、PandaSQL
      • 1.1、PandaSQL简介
      • 1.2、Pandas与PandaSQL解决方案对比
      • 1.3、PandaSQL支持的窗口函数
      • 1.4、PandaSQL综合使用案例
    • 2、DuckDB
      • 2.1、DuckDB简介
      • 2.2、SQL操作(SQL On Pandas)
      • 2.3、逻辑SQL(DSL on Pandas)
      • 2.4、DuckDB on Apache Arrow
      • 2.5、DuckDB On fsspec Filesystems
      • 2.6、文件数据导入导出
      • 2.7、DuckDB扩展数据源
      • 2.8、DuckDB的SQL语法
      • 2.9、DuckDB客户端接口
      • 2.10、DuckDB分区与谓词下推


1、PandaSQL

1.1、PandaSQL简介


Pandas在数据处理方面提供了几乎全部的类SQL查询操作API,例如drop_duplicates()代表SQL中的union合并去重

但PandasAPI不如直接的SQL简洁易读,例如,Pandas还无法替代的操作之一是非等连接(查询连接条件包含非等号,如大于号、小于号等),需要多步实现,这在SQL中非常简单,PandaSQL可以很好的解决这个问题

PandaSQL是一个可以直接在Python中使用SQL语法查询Pandas数据框Dataframe的框架,PandaSQL底层调用PandasAPI

另外,Python虽然内置有SQLite数据库,但如果我们想使用SQL语句查询DataFrame就必须将原始数据先插入到SQLite

虽然PandaSQL允许我们在Pandas数据帧上运行SQL(SQLite语法)查询,但它的性能不如原生PandasAPI语法

安装:

pip install -U pandasql

PandaSQL API简介:

'''
sqldf(query, env, db_uri)
- query:使用DataFrame作为表的sql查询
- env:环境globals()或locals(),允许sqldf访问Python环境中的全局或局部变量
- db_uri:SQLAlchemy兼容的数据库URI,默认为sqlite:///:memory:
返回:返回查询结果DataFrame
'''

封装SQL查询:

from pandasql import sqldfdef query(q: str, env=None):return sqldf(q, env=globals()) if env is None else sqldf(q, env=env)

1.2、Pandas与PandaSQL解决方案对比


1)数据准备

# 商品促销活动时期表
df_promotion = pd.DataFrame({"pdt_id": ["p01", "p02", "p03"],"start_dt": ["10-06-2023", "20-06-2023", "15-08-2023"],"end_dt": ["12-06-2023", "25-06-2023", "20-08-2023"]
})# 商品交易数据表
df_trading = pd.DataFrame({"id": ["p01", "p01", "p02", "p02", "p02", "p03", "p03"],"trade_dt": ["11-06-2023", "20-06-2023", "15-08-2023", "22-06-2023", "11-06-2023", "17-08-2023", "29-08-2023"],"sales": [10, 20, 30, 22, 30, 20, 34]
})print(df_promotion.to_string())
print(df_trading.to_string())

2)需求描述

查询促销期间商品的销售额

3)Pandas解决方案

# 合并
df_merge = pd.merge(df_promotion, df_trading, left_on="pdt_id", right_on="id")
# print(df_merge.to_string())
# 非等连接查询
df_query = df_merge[(df_merge["trade_dt"] >= df_merge["start_dt"]) & (df_merge["trade_dt"] <= df_merge["end_dt"])]
# 选择字段
df_res = df_query[[
http://www.dinnco.com/news/64831.html

相关文章:

  • 网站后台修改内容看不见了推广软文营销案例
  • 购物网站app推广方案推特是谁的公司
  • 横岗做网站app拉新平台有哪些
  • 免费网站建设seo网站自然排名怎么优化
  • 网站多久会被百度收录seo网站诊断
  • wordpress去除首页网络优化的工作内容
  • 网站制作培训机构seo域名如何优化
  • 高校学校网站建设写软文能赚钱吗
  • 新都有没有做网站的建网站一般多少钱
  • 权威的企业网站建设北京seo排名公司
  • 多产品的网站怎么做seo外贸独立站建站
  • 湘潭seo磐石网络seo入门培训班
  • 网站申请支付宝接口网上网络推广
  • 网站连通率东莞网站推广的公司
  • 网站建设项目工作分解建设网页
  • 查权重西安排名seo公司
  • 怎么做招标公司网站无锡seo关键词排名
  • 娱乐网站开发免费建站有哪些
  • 24小时国内新闻大事宁波seo网络推广优化价格
  • 怎样找到工厂直招网站合肥seo搜索优化
  • 网页设计与制作大纲网络优化是做啥的
  • 做微网站的第三方登录界面百度关键词优化推广
  • 门户网站怎么开发网络运营团队
  • 云南省住房建设厅网站网站推广的常用方法有哪些?
  • 公众号和网站先做哪个百度智能云官网
  • 成都制作网站陕西seo公司
  • 网站上面的内容里面放照片怎么做郑州做网站最好的公司
  • php做商品网站遵义网站seo
  • 锦州网站制作公司百度世界排名
  • 做网站推广代理百度网站关键词排名查询