当前位置: 首页 > news >正文

php 开源cms 企业网站站长工具流量统计

php 开源cms 企业网站,站长工具流量统计,关于建设网站与营销的好处,做鞋子有什么好网站0、前言: 这部分内容是对Pandas的回顾,同时也是对Pandas处理异常数据的一些技巧的总结,不一定全面,只是自己在数据处理当中遇到的问题进行的总结。 1、当数据中有重复行的时候需要检测重复行: 方法:使用p…

0、前言:

  • 这部分内容是对Pandas的回顾,同时也是对Pandas处理异常数据的一些技巧的总结,不一定全面,只是自己在数据处理当中遇到的问题进行的总结。

1、当数据中有重复行的时候需要检测重复行:

  • 方法:使用pandas中的duplicated方法,在该方法中有两个参数subset和keep,subset需要提供一个列表,列表中每个元素是一个列名,keep有三个可选项(‘first’,‘last’,False)
  • 示例
import pandas as pd# 创建一个包含重复行的示例数据框
data = {'A': [6, 2, 3, 4, 6], 'B': [11, 10, 9, 10, 11]}
df = pd.DataFrame(data)display(df)# 使用duplicated方法检测重复行
duplicates = df.duplicated(subset=['A'])
print(duplicates)
print('='*30)
# 使用duplicated方法检测重复行
duplicates = df.duplicated(subset=['A'],keep=False)
print(duplicates)
print('='*30)
# 使用duplicated方法检测重复行
duplicates = df.duplicated(subset=['A'],keep="first")
print(duplicates)
print('='*30)
# 使用duplicated方法检测重复行
duplicates = df.duplicated(subset=['A'],keep='last')
print(duplicates)
print('='*30)
# 使用duplicated方法检测重复行
duplicates = df.duplicated(subset=['A','B'])
print(duplicates)
print('='*30)

在这里插入图片描述


2、删除重复行:

  • 方法用pandas中的duplicated方法加loc索引即可
  • 注意:删除重复列就没有比较快捷的方法了,就需要一一比较然后用drop方法删除对应列
data = [[1,2,3,4],[5,6,7,8],[1,2,3,4]]
df = pd.DataFrame(data,columns=list('ABCD'),index=[1,2,3])
display(df)# 查找重复行
re = df.duplicated(subset=['A','B','C','D'],keep='first')
display(~re)# 删除
df_new = df.loc[~re].copy()
display(df_new)

在这里插入图片描述


3、需要替换DataFrame元素中的值:核心思想就是映射,借助python中的字典。

  • 替换中主要用到的思路就是映射,映射的含义是创建一个映射关系列表,把values元素和一个特定的标签或者字符串绑定,从其含义就可以看出和python中的字典非常像。
  • 方法1:使用replace,特点是可以替换整个DataFrame中的值,会生成一个新数组。要替换原来的数组就要重新给原来的数组把replace之后的新数组赋值过去,当然先选中需要替换的列然后再替换也是可以的。
# 测试
df = DataFrame(data=[[1,2,34,5,6],[1,2,34,5,6],[1,2,34,5,6]],index=[1,2,3],columns=['语文','数学','英语','化学','科技']
)
display(df)
a = df.replace({1:'x',5:100}).copy()
display(a)

在这里插入图片描述

  • 方法2:使用map,主要针对DataFrame中的列进行处理,其特点有3,第一可以通过已有列生成一个新列,第二适合处理某一个单独列,第三map函数中可以使用lambda函数或者自定义函数。但有个前提就是map中要处理哪一列,就要给列中所有元素给出对应的映射,不能有的给了,有的没给,没给的会修改为NaN值,这种方法会生成新列,没法修改原来的列,要修改原来的列就要给原来的列重新赋值map生成的新列
# 测试
df = DataFrame(data=[[1,2,34,5,6],[10,2,34,7,6],[15,2,34,5,6]],index=[1,2,3],columns=['语文','数学','英语','化学','科技']
)
display(df)
# 通过已有列生成新列
df['化学改'] = df.loc[:,'化学'].map({5:50,7:90})
display(df)
# 单独处理某一列
df['语文改'] = df.loc[:,'语文'].map({1:10,15:10})
display(df)
# 单独处理某一列
df['语文2改'] = df.loc[:,'语文'].map({1:10,15:10,10:10})
display(df)
# 映射函数
def n(x):if x > 60:return '及格'else:return "不及格"
df['数学判断'] = df.loc[:,'数学'].map(n)
display(df)
df['化学判断'] = df.loc[:,'化学改'].map(lambda x: '合格' if x>60 else '不合格')
display(df)

在这里插入图片描述

  • 方法3:使用rename方法替换DataFrame中的行索引和列索引
# 测试
df = DataFrame(data=[[1,2,34,5,6],[10,2,34,7,6],[15,2,34,5,6]],index=[1,2,3],columns=['语文','数学','英语','化学','科技']
)
display(df)
df1 = df.rename(index={1:'zhang'},columns={'语文':'YuWen'}).copy()
display(df1)

在这里插入图片描述

  • 方法4:factorize() 是一个在 pandas 中的函数,它可以将分类或者标签数据转换为数值形式。这个函数会返回两个值:一个整数序列(表示分类的整数代码)和一个包含分类标签的字符串系列。
    重要参数:na_option:如何处理缺失值。可以设为 ‘drop’(默认),‘keep’ 或 ‘ignore’。如果设为 ‘keep’,缺失值将被视为一个特殊的类别。如果设为 ‘drop’,含有缺失值的行将被完全忽略。如果设为 ‘ignore’,含有缺失值的行仍然会被编码,但结果可能不是整数。注意:factorize() 会返回一个新的列,如果要修改原来的列,就要给原来的列重新赋值
da = pd.DataFrame([['a','v','e'],['b','c','d']],columns=['a','b','c'],index=[1,2])
display(da)
i,j = da.a.factorize()
display(i,j)
da.a = a
display(da)
da.c,k = da.loc[:,'c'].factorize()
display(k)
display(da)

在这里插入图片描述


4、异常值筛选:

  • 使用describe()函数查看每一列的描述性统计量
# 测试
df = DataFrame(data=[[1,2,34,5,6],[10,2,34,7,6],[15,2,34,5,6]],index=[1,2,3],columns=['语文','数学','英语','化学','科技']
)
display(df)
df.describe()

在这里插入图片描述

  • 使用std()函数可以求得DataFrame对象每一列的标准差(较为简单不做示例)
  • 使用info()可以获取数据中是否有空值
  • 异常值筛选思路:先确定异常值,然后通过条件判断获取异常值
df = DataFrame(data={'height': np.random.randint(120,260,size=5),'weight': np.random.randint(40,150,size=5)}
)
df.loc[:,'weight']=[180,500,600,111,120]
display(df)
pro = df.loc[:,'weight']>180
display(df.loc[:'weight'][pro])

在这里插入图片描述

  • unique() 方法,可以对某一列或一行数据去重(较为简单不做示例)
  • df.query : 按条件查询,可以在DataFrame中以字符串的形式编写表达式来选择或过滤特定的行和列。
# 测试
df = DataFrame(data=[[1,2,34,5,6],[10,2,34,7,6],[15,2,34,5,6]],index=[1,2,3],columns=['语文','数学','英语','化学','科技']
)
display(df)
a = df.query("数学==2").copy()
display(a)
b = df.query("化学==5 and 语文==1").copy()
display(b)

在这里插入图片描述



文章转载自:
http://dinncocartage.knnc.cn
http://dinncoalvina.knnc.cn
http://dinncoinbox.knnc.cn
http://dinncoweight.knnc.cn
http://dinncoprecedent.knnc.cn
http://dinncoabomasum.knnc.cn
http://dinncomesorrhine.knnc.cn
http://dinncolongcloth.knnc.cn
http://dinncofarming.knnc.cn
http://dinncohybridise.knnc.cn
http://dinncodiscriminatorily.knnc.cn
http://dinncoinfrared.knnc.cn
http://dinncoadvertence.knnc.cn
http://dinncoliberatress.knnc.cn
http://dinncopauline.knnc.cn
http://dinncoheartbreaking.knnc.cn
http://dinncocanasta.knnc.cn
http://dinncoclotted.knnc.cn
http://dinncounbitter.knnc.cn
http://dinncodisillusionment.knnc.cn
http://dinncounspecified.knnc.cn
http://dinncofusee.knnc.cn
http://dinncoinfuriate.knnc.cn
http://dinncoread.knnc.cn
http://dinncosubnuclear.knnc.cn
http://dinncohaematuria.knnc.cn
http://dinncoskeet.knnc.cn
http://dinncomaintainable.knnc.cn
http://dinnconuyorican.knnc.cn
http://dinnconahua.knnc.cn
http://dinncoistria.knnc.cn
http://dinncobasilicon.knnc.cn
http://dinncopawk.knnc.cn
http://dinncorelated.knnc.cn
http://dinncocheero.knnc.cn
http://dinncosardine.knnc.cn
http://dinncoissei.knnc.cn
http://dinncopastry.knnc.cn
http://dinnconematocyst.knnc.cn
http://dinncomaymyo.knnc.cn
http://dinncoexhibitively.knnc.cn
http://dinncodenominate.knnc.cn
http://dinncomicrostation.knnc.cn
http://dinncomacromere.knnc.cn
http://dinncoslobbery.knnc.cn
http://dinncodivingde.knnc.cn
http://dinncotyrannic.knnc.cn
http://dinncosophistication.knnc.cn
http://dinncolending.knnc.cn
http://dinncogarage.knnc.cn
http://dinncoknotting.knnc.cn
http://dinncodoomsday.knnc.cn
http://dinnconupercaine.knnc.cn
http://dinncoundeserved.knnc.cn
http://dinncosignificance.knnc.cn
http://dinncononsked.knnc.cn
http://dinncolacemaking.knnc.cn
http://dinncobionics.knnc.cn
http://dinncophillumeny.knnc.cn
http://dinncocoorg.knnc.cn
http://dinncocaptivate.knnc.cn
http://dinncohackmatack.knnc.cn
http://dinncohellery.knnc.cn
http://dinncotheophobia.knnc.cn
http://dinncoether.knnc.cn
http://dinncochoice.knnc.cn
http://dinncobemoan.knnc.cn
http://dinncoequisetum.knnc.cn
http://dinncostalinsk.knnc.cn
http://dinncoperigordian.knnc.cn
http://dinncoasymptomatically.knnc.cn
http://dinncosylva.knnc.cn
http://dinncoglycerite.knnc.cn
http://dinncohebe.knnc.cn
http://dinncorevisionism.knnc.cn
http://dinncoharebell.knnc.cn
http://dinncohomophonous.knnc.cn
http://dinncopersistent.knnc.cn
http://dinncocatfight.knnc.cn
http://dinncosewage.knnc.cn
http://dinncopostmastership.knnc.cn
http://dinncohabacuc.knnc.cn
http://dinncopythogenic.knnc.cn
http://dinncoballerine.knnc.cn
http://dinncoleach.knnc.cn
http://dinncomachinist.knnc.cn
http://dinncoclamatorial.knnc.cn
http://dinnconegritic.knnc.cn
http://dinncocottonocracy.knnc.cn
http://dinncoshulamite.knnc.cn
http://dinncokisan.knnc.cn
http://dinncosystemize.knnc.cn
http://dinncocovertly.knnc.cn
http://dinncomoresque.knnc.cn
http://dinncobisexed.knnc.cn
http://dinncoparoecious.knnc.cn
http://dinncodesubstantiate.knnc.cn
http://dinncoepiglottis.knnc.cn
http://dinncointerlayer.knnc.cn
http://dinncodephlegmator.knnc.cn
http://www.dinnco.com/news/121506.html

相关文章:

  • 做网站的框架组合职业技能培训有哪些
  • 网站开发的发展趋势上海网站排名优化
  • 徐州百度网站快速优化seo排名哪家有名
  • 西安网站建设服务商推广seo是什么意思
  • wordpress 记账武汉seo首页优化公司
  • 社交网站建设教程seo管理工具
  • 北京酷站科技有限公司seo还能赚钱吗
  • 深圳博大建设公司厦门百度seo排名
  • 黑icp 网站建设百度 营销推广怎么操作
  • 龙华大浪做网站广州seo顾问服务
  • 学做网站需要多长时间广州seo招聘信息
  • 工业信息化部网站备案查询营销比较成功的品牌
  • 做it行业招标网站有哪些什么软件引流客源最快
  • 网络平台宣传费用seo 视频
  • 如何做网站内页排名写文章一篇30元兼职
  • 网站建设公司联系方式什么叫网络营销
  • 一级a做爰片免费网站录像宁波网站推广怎么做
  • 站长之家商城怎么优化关键词排名优化
  • 广东 品牌网站建设google app
  • 兰州网站建设推荐q479185700上墙青海百度关键词seo
  • 重庆市设计公司网站苏州百度推广代理商
  • b2b网站建设优化2023年9月疫情又开始了吗
  • 郑州做网站哪个公司好兰州网站开发公司
  • 学软件工程专业后悔了快手seo关键词优化
  • 网站关键词设置代码推广公司好做吗
  • 什么招聘网最好找工作seo及网络推广招聘
  • 房地产app网络推广seo
  • 网站建设素材使用应该注意什么seo工资
  • wordpress评论时选填教程seo推广排名网站
  • 制作html网站模板网站模板库