当前位置: 首页 > news >正文

专题网站开发 交互方法浏览器谷歌手机版下载

专题网站开发 交互方法,浏览器谷歌手机版下载,网站建设的基本流程和步骤,做网站系统学校大数据系列之:读取parquet文件统计数据量 一、Spark读取parquet文件统计数据量二、parquet-tools统计parquet文件数据量三、实际应用案例 一、Spark读取parquet文件统计数据量 首先,创建一个 SparkSession 对象: val spark SparkSession.b…

大数据系列之:读取parquet文件统计数据量

  • 一、Spark读取parquet文件统计数据量
  • 二、parquet-tools统计parquet文件数据量
  • 三、实际应用案例

一、Spark读取parquet文件统计数据量

  1. 首先,创建一个 SparkSession 对象:
val spark = SparkSession.builder().appName("Parquet Data Count").getOrCreate()
  1. 然后,使用 SparkSession 读取 Parquet 文件并将其转换为 DataFrame:
val data = spark.read.format("parquet").load("/path/to/hdfs/parquet/file")
  1. 最后,使用 DataFrame 的 count 方法进行数据量统计:
val count = data.count()

二、parquet-tools统计parquet文件数据量

下载parquet-tools工具

使用 Hadoop 命令行工具:

  1. 首先,使用 Hadoop 命令行工具 hadoop 运行以下命令:
hadoop fs -cat /path/to/hdfs/parquet/file | parquet-tools rowcount
  1. 该命令将读取 Parquet 文件并使用 parquet-tools 工具来统计数据量,并输出结果。

三、实际应用案例

读取hdfs上的parquet文件:

%sparkval data = spark.read.format("parquet").load("/optics/ods_optics_prod/packing_data_item_1h_a/datetime=2023122514/part-00000-2675f81c-3c90-4af7-a489-bd8ce5cfec2c-c000.zstd.parquet")

查看数据量:

%spark
val count = data.count()count: Long = 433173
http://www.dinnco.com/news/86890.html

相关文章:

  • 扬州学做网站培训多少钱新站整站优化
  • 国家市场监督管理总局60号令seoul是哪个城市
  • 安阳网站建设策划广告推广渠道
  • 摇滚中国发展史日本人做的网站怎么开自己的网站
  • 北京盛赛车网站开发站长分析工具
  • 衡水购物网站制作重庆网站推广专家
  • 郑州的设计公司seo兼职怎么收费
  • 怎样制作网页且有链接seo关键词优化推广外包
  • 网站域名注册费用google网页版登录入口
  • 桓台县建设局网站十大免费网站推广入口
  • 网站做好了 怎么做解析今日新闻7月1日
  • wordpress商店模板seo在线优化排名
  • a标签下载wordpress网站怎么优化排名靠前
  • 怎么在南京人社网站做失业登记代做网页设计平台
  • 网站优化 济南7月新闻大事件30条
  • 如何设置网站网络广告营销有哪些
  • 电子商务网站设计内容网络推广策划方案
  • 直播视频下载seo公司是做什么的
  • 公司做网站服务费怎样做账购买域名
  • 郑州网站建设知名公司排名百度下载安装 官方
  • 商丘做网站汉狮网络潍坊网站建设公司
  • 大连高端网页公司seo是什么东西
  • 如何做贴吧类网站多钱软文广告有哪些
  • 太仓网站建设在线培训平台有哪些
  • 湖南网站建设企业长沙网
  • 什么网站上做效果图可以赚钱seo技术网网
  • 机械设备做公司网站三只松鼠软文范例500字
  • 什么网站专门学做湖北菜上海关键词优化报价
  • wordpress主题站模板下载网站建设公司地址在哪
  • 招商加盟网站大全一个公司可以做几个百度推广