当前位置: 首页 > news >正文

在线做网站淘宝怎么做引流和推广

在线做网站,淘宝怎么做引流和推广,在深圳做网站,山西太原网站建设公司哪家好1.课程目标和课程内容介绍 2.数仓维度建模设计 3.数仓为什么要分层 4.数仓分层思想和作用 下面是阿里的一种分层方式 5.数仓中表的种类和同步策略 6.数仓中表字段介绍以及表关系梳理 订单表itcast_orders 订单明细表 itcast_order_goods 商品信息表 itcast_goods 店铺表 itcast…

1.课程目标和课程内容介绍

2.数仓维度建模设计

 

3.数仓为什么要分层

4.数仓分层思想和作用

下面是阿里的一种分层方式

5.数仓中表的种类和同步策略

6.数仓中表字段介绍以及表关系梳理

订单表itcast_orders

订单明细表 itcast_order_goods

商品信息表 itcast_goods

店铺表 itcast_shops

商品分类表 itcast_goods_cats

组织结构表 itcast_org

订单退货表 itcast_order_refunds

用户表 itcast_users

用户收货地址表 itcast_user_address

支付方式表 itcast_payments

7.项目环境初始化

导入MySQL模拟数据

将SQL文件上传到Linux

登入MySQL并执行命令

已经上传成功

hive分层说明

登入hive,创建表

创建ods层数据表

因为后面要用spark执行,spark对我们的Parquet和Snappy是执行的最好的

粘贴过来执行

数据采集

这里的命令可以帮我们对hive分区表进行一个修复

将小于${dt}(默认时间点)之前的当做全量要采集的数据,直接采集过来

我们打开kettle看一下

这里的${dt}是我们的默认命名参数

我们双击转换的空白处,看一下

上面的三张表是使用${dt}限制的

其余的表都是全量采集

比如

下面看一下字段选择

里面的每一个时间字段都要指定格式

下面看一下字段选择

这里我们要指定路径,

我们要写数据到hive表,使用表输出的方式太慢

我们直接将数据文件生成到hdfs路径上,这个路径就是我们的某一张hive表对应的路径

要指定hadoop cluster的连接

由于我们全是分区表,所以我们要加上分区文件的路径

所有的date类型要改成utf-8,date后面会出现问题

因为我们前面已经指定了格式

这里我们就按照字符串的形式写进去

==================================================================================================================================================

上面设置结束后,我们就可以执行我们的作业

我们再去hive表里面验证一下

8.缓慢变化维问题以及常见解决方案

9.商品案例-每日全量采集方案

10.每日全量案例实现

 MySQL&Hive初始化

先创建库

上面表创建成功

增量导入12月20日数据

这里主要是帮我们添加一个分区(如果分区不存在,就添加)

最后双击空白处

调整转换命名参数

上面已经成功导入hive的ods层了,已经查询到

下面再将数据导入维度表,导入dw层

增量导入12月21日数据

运行之后是将数据存储到了ods的12月21号的分区

我们查看一下

如果我们查询的时候没有指定分区,应该有10条数据

增量导入12月22日数据

11.拉链表技术介绍

12.拉链表技术实现-第一次导入数据到拉链表

MySQL&Hive表初始化

这里的表不是分区表了,用一张大表构建

全量导入2019年12月20日数据

13.拉链表技术实现-历史数据更新

增量导入2019年12月21日数据

MySQL数据库导入12月21日数据(6条数据)

这里我们总共要采集001、005、006三条数据

他们的modifytime的字段一定是21号的

使用Kettle开发增量同步MySQL数据到Hive ods层表

这里首先执行的SQL语句是hive进行操作的

这里的SQL操作就是根据modifytime字段,找出新增或者更新的数据

编写SQL处理dw层历史数据,重新计算之前的dw_end_date

=============================

注意:这里很重要,因为有可能我们的表经过多次更新

但我们只需要修改最近一次的更新的那一条数据

14.拉链表技术实现-新增数据插入以及合并

最后的效果

15.

http://www.dinnco.com/news/30801.html

相关文章:

  • 织梦农家乐网站模板石家庄seo排名外包
  • 网站后台根据前端做吗seo上排名
  • 网站前台乱码客户引流的最快方法是什么
  • 网站空间 云端seo报价单
  • 企业查询显示利好什么意思seo快速排名关键词
  • 西安米德建站企业网站是什么
  • 沈阳 网站建设百度推广开户流程
  • 东莞常平社保局电话黑帽seo是作弊手法
  • 网站建设实习困难网站建设及网站推广
  • 动漫设计学院搜索引擎优化工具有哪些
  • 东莞专业做网站公司小红书关键词热度查询
  • 水果销售网站开发文献综述刷排名seo
  • 南京网站开发注册app宁波seo智能优化
  • 网站怎么做图片动态图片不显示了网站seo具体怎么做?
  • 做期货关注什么网站抖音seo怎么做的
  • 做图解的网站十大搜索引擎神器
  • 网站活泼搜索指数的数据来源是什么
  • 建设商务网站的费用郑州网络推广软件
  • 外贸soho网站排名软件优化
  • 广州网站站建设培训做一个简单的网站需要多少钱
  • 做婚纱网站的图片素材浙江网站建设制作
  • 网站建设客户管理系统什么是域名
  • 外贸sohoseo技术外包
  • 企业网站模板下载psd格式精准客源
  • 检测WordPress主题的网站长春网站快速优化排名
  • 深圳做网站网络公司百度关键词seo排名优化
  • pacdora 设计网seo优化快排
  • 网站上动态图片怎么做十大免费网站推广入口
  • 网站建设培训网站代运营竞价公司
  • 电子商务网站建设的基本步骤百度销售平台怎样联系