当前位置: 首页 > news >正文

青岛网站设计如何做今日实时热搜

青岛网站设计如何做,今日实时热搜,手册制作,承德网站建设步骤目录 Hive 复合数据定义方法 Hive 复合数据查询方法 hive 内置函数 上机练习 Hive 复合数据定义方法 Hive 复合数据查询方法 hive 内置函数 -- 查看系统自带的函数 show functions; -- 显示自带的函数的用法 desc function upper; -- 详细显示自带的函数的用法 desc …

目录

Hive 复合数据定义方法

Hive 复合数据查询方法

hive 内置函数

上机练习


Hive 复合数据定义方法

Hive 复合数据查询方法

hive 内置函数

-- 查看系统自带的函数
show functions;
-- 显示自带的函数的用法
desc function upper;
-- 详细显示自带的函数的用法
desc function extended upper;

上机练习

1 导入 user 数据 id name sex age address date lev s_info m_info a_info
2 使用三种复合数据类型 struct map array 存储 info 数据
python 清洗数据:
with open(r"D:\智云大数据\数据源
\user\user_info.txt",'r',encoding="utf-8") as f:
LineRead=f.readlines()
# print(LineRead)
for i in LineRead:
list1=[]
list_i=i.split('\t')
# print(list_i)
# 把字典的值复制加到每行的末尾
for j in eval(list_i[7]).values():
list1.append(j)
str1='|'.join(list1)
list_i[7]=str1
list_i.append(str1)
# print(list_i)
list_i[8]='|'.join(list_i[8].split(',')).strip('\n') #
把第九列转化成可以导入 struct 的形式
str_i=','.join(list_i) # 每行每个数据用逗号隔开
# print(str_i)
with open(r"D:\智云大数据
\user_info_disposal_new.txt",'a',encoding='utf-8') as h:
h.writelines(str_i+"\n")
h.close()
f.close()
hive 建表和导入数据:
drop table if exists user_info;
create table if not exists user_info
(
id int,
name string,
sex string,
age tinyint,
address string,
date_info string,
lev tinyint,
a_info array<string>,
m_info map<string,string>,
s_info
struct<systemtype:string,education:string,marriage_status:string,phon
ebrand:string>
)
row format delimited
fields terminated by ','
collection items terminated by '|'
MAP keys terminated by ':'
lines terminated by '\n'
load data local inpath '/root/user_info_disposal_new.txt'
into table user_info;
结果:(双击 object 能看见值)
3 指标计算
3.1 按月统计各个地区男女生人数
select date_format(date_info,'YYYY-MM'),address,sex,count(1) from
user_info
group by date_format(date_info,'YYYY-MM'),address,sex3.2 统计各地区的不同手机型号使用人数,并按照老中青(35 以下青年 男 65 岁
以下女 55 岁以下中年 男 65 岁以上女 55 岁以上老年)年龄 划分
地区 安卓使用人数{老 中 青} ios 使用人数{老 中 青}
with SystemtypeAndAge as
(
select
case when m_info["systemtype"]='android' then 'android'
when m_info["systemtype"]='ios' then 'ios'end as systemtype,
case when age<35 then '青年'
when sex='male' and age<65 or sex='female' and age<55 then '中年'
else '老年'
end as AgeBracket
from user_info
)
select systemtype,AgeBracket,count(1) from SystemtypeAndAge
group by systemtype,AgeBracket

3.2 统计各地区的不同手机型号使用人数,并按照老中青(35 以下青年 男 65 岁
以下女 55 岁以下中年 男 65 岁以上女 55 岁以上老年)年龄 划分
地区 安卓使用人数{老 中 青} ios 使用人数{老 中 青}
with SystemtypeAndAge as
(
select
case when m_info["systemtype"]='android' then 'android'
when m_info["systemtype"]='ios' then 'ios'end as systemtype,
case when age<35 then '青年'
when sex='male' and age<65 or sex='female' and age<55 then '中年'
else '老年'
end as AgeBracket
from user_info
)
select systemtype,AgeBracket,count(1) from SystemtypeAndAge
group by systemtype,AgeBracket

3.3 统计不同地区,不同学历,使用的手机品牌(去重)collect_list
地区 学历 手机品牌列表
select user_info.address,education
,collect_list(distinct m_info["phonebrand"])
from user_info
left join
(
select address,
case m_info["education"] when "bachelor" then 'bachelor'
when "doctor" then 'doctor'when "master" then 'master'
end as education
from user_info
) EducationInAddress on user_info.address=EducationInAddress.address
group by user_info.address,education

3.4 统计不同等级,各个手机品牌的使用人数(需要行转列)
等级 phonebrand_list
{iphone6:5 iphone7:5 .....mi:5 .....iphoneXS:2}
这题我不会,老师沉迷黑吗喽作业视频讲解都还没发......
第三阶段太吃自学能力了,hive语法基本要去网上找。
http://www.dinnco.com/news/28274.html

相关文章:

  • 辽宁seo甘肃省seo关键词优化
  • 网站这么做优化简述seo和sem的区别与联系
  • 网站创建桌面快捷方式百度搜索资源管理平台
  • 南昌网站设计案例免费培训网站
  • 常熟有没有做阿里巴巴网站微营销软件
  • 网站开发 安全合同国内新闻大事20条简短
  • 景县网址建站千锋教育可靠吗
  • 网页制作与网站建设完全学习手册下载seo网站关键词排名快速
  • 网页修改和编辑的软件有哪些无线网络优化
  • 怎么样做美术招生信息网站百度官网首页登录
  • 驻马店标准网站建设seo培训学院官网
  • 沧州南皮手机网站建设嵌入式培训
  • 威海市高区建设局网站浙江seo关键词
  • 东莞做网站最好的是哪家推广app赚佣金平台有哪些
  • 天津城乡住房建设厅网站首页网站运营师
  • 山东建设局网站电工西安seo技术培训班
  • 网站没有备案可以做seo优化吗百度广告优化师
  • 慈溪企业网站seo网站点击快速排名
  • 自助建站基础工作主要包括()腾讯网qq网站
  • 朝阳网站开发联系电话企业seo网络营销
  • 关于做网站的了解点seo优化多少钱
  • 餐饮系统的网站应该怎么做关键词搜索挖掘爱网站
  • 做网站需要备案吗长沙官网优化公司
  • 黄岩做网站重庆网站seo搜索引擎优化
  • 霸州做网站安徽网站推广公司
  • 两个路由器做双网站自己建网站流程
  • 平台手机端网站开发竞价推广代运营服务
  • 泰安每日房产成交数据湖南seo服务
  • wordpress建企业网站设置宣传营销方式有哪些
  • 吉林市市政建设集团网站指数查询