当前位置: 首页 > news >正文

北京市企业信用信息查询网沈阳关键词seo

北京市企业信用信息查询网,沈阳关键词seo,百度广告标识,wordpress调用上传业务中有这样一个场景,我想实现的是将dataframe表table1中的字段b1与c1的内容使用下划线_连接起来列的名字为d1,比如比如学习_1,睡觉_2,吃饭_3,这是我的第一个需求;随后我想保留的是dataframe表table1中的字段d1中的数据比如学习_…

        业务中有这样一个场景,我想实现的是将dataframe表table1中的字段b1与c1的内容使用下划线_连接起来列的名字为d1,比如比如学习_1,睡觉_2,吃饭_3,这是我的第一个需求;随后我想保留的是dataframe表table1中的字段d1中的数据比如学习_1,睡觉_2,吃饭_3,中的数据中_前后的数据分别作为两列e1,f1,该怎么写这个spark代码,我的想法是使用withclumn函数及split函数.

        sql来写的话就是使用subString函数来进行_匹配,比如说

sql代码

SELECT SUBSTRING_INDEX(a1, '_', 1) AS a2
FROM table1;

Spark代码

创建一个DataFrame,名为table1,将b1c1字段的内容使用下划线连接起来,并将新的列命名为d1

import org.apache.spark.sql.functions._  val table1 = Seq(  ("学习", "1"),  ("睡觉", "2"),  ("吃饭", "3")  
).toDF("b1", "c1")  val table1_d1 = table1.withColumn("d1", concat($"b1", "_", $"c1"))

使用split函数将d1字段中的数据拆分为两列e1f1

val table1_d1_split = table1_d1.withColumn("e1", split(col("d1"), "_")(0))  .withColumn("f1", split(col("d1"), "_")(1))table1_d1_split.show()

table1_d1_split DataFrame将包含新的列e1f1,分别包含下划线前后的数据

+------+------+------+------+------+  
|   b1 |   c1 |   d1 |   e1 |   f1 |  
+------+------+------+------+------+  
| 学习 |   1  | 学习_1 | 学习 |   1  |  
| 睡觉 |   2  | 睡觉_2 | 睡觉 |   2  |  
| 吃饭 |   3  | 吃饭_3 | 吃饭 |   3  | 

sql的就是不断地截取

http://www.dinnco.com/news/4247.html

相关文章:

  • 做微信表情的微信官方网站免费建站的平台
  • 宝鸡营销型网站开发公司龙岗网站建设
  • 工商网站2023新闻摘抄十条
  • 可可里小姐网站建设安卓优化大师下载安装
  • 网站ar怎么做百度一下百度主页官网
  • 协会网站建设方案竞价推广工具
  • 廊坊做网站的电话长沙网站seo
  • 网站建设规划方案一套完整的运营方案
  • 做淘客网站要备案接广告推广
  • wordpress好看的背景图片搜索引擎优化期末考试答案
  • 环保网站建设费用营销策略的重要性
  • 重庆网站建设网领科技赤峰seo
  • wordpress公司企业成都百度推广和seo优化
  • 上海三凯建设管理咨询有限公司网站八上数学优化设计答案
  • 直销网站建设平台网上广告宣传怎么做
  • 做网站开发 甲方提供资料5118和百度指数
  • 网站+做+app百度广告
  • 设计灵感网站整理全国疫情最新消息今天新增
  • 作文库网站成品ppt网站国外
  • 天河做网站平台网络服务器配置与管理
  • PHP做的网站能容纳多少人怎样做网站推广啊
  • 微信开放平台官方网站5118数据分析平台官网
  • 四川酒店网站建设免费优化
  • 温州 网站建设网站seo百度百科
  • 校园网站建设 必要性分析南京网站快速排名提升
  • 菠菜网站开发哪家好谷歌外链代发
  • 手机网站图片优化网络营销推广方案论文
  • 郑州中原影视城网络推广seo怎么做
  • 网站加速cdnseo优化方案模板
  • 照着别人网站做市场营销八大营销模式