一次性彻底讲透Python中pd.concat与pd.merge

 更新时间:2022-06-15 10:06:35   作者:佚名   我要评论(0)

目录数据拼接:pd.concat数据关联:pd.merge两者区别数据的合并与关联是数据处理过程中经常遇到的问题,在SQL、HQL中大家可能都有用到 join、

数据的合并与关联是数据处理过程中经常遇到的问题,在SQL、HQL中大家可能都有用到 join、uion all 等 ,在 Pandas 中也有同样的功能,来满足数据处理需求,个人感觉 Pandas 处理数据还是非常方便,数据处理效率比较高,能满足不同的业务需求

数据拼接:pd.concat

concat 是pandas级的函数,用来拼接或合并数据,其根据不同的轴既可以横向拼接,又可以纵向拼接

函数参数

pd.concat(
    objs: 'Iterable[NDFrame] | Mapping[Hashable, NDFrame]',
    axis=0,
    join='outer',
    ignore_index: 'bool' = False,
    keys=None,
    levels=None,
    names=None,
    verify_integrity: 'bool' = False,
    sort: 'bool' = False,
    copy: 'bool' = True,
) -> 'FrameOrSeriesUnion'
  • objs:合并的数据集,一般用列表传入,例如:[df1,df2,df3]
  • axis:指定数据拼接时的轴,0是行,在行方向上拼接;1是列,在列方向上拼接
  • join:拼接的方式有 inner,或者outer,与sql中的意思一样

以上三个参数在实际工作中经常使用,其他参数不再做介绍

案例:

图片

模拟数据

横向拼接

图片

横向拼接-1

字段相同的列进行堆叠,字段不同的列分列存放,缺失值用NAN来填充,下面对模拟数据进行变换用相同的字段,进行演示

图片

横向拼接-2

纵向拼接

图片

纵向拼接

可以看出在纵向拼接的时候,会按索引进行关联,使相同名字的成绩放在一起,而不是简单的堆叠

数据关联:pd.merge

数据关联与SQL中的join基本一样,一次可以关联两个数据表,有左表、右表的区分,需要可以指定关联的字段

函数参数

pd.merge(
    left: 'DataFrame | Series',
    right: 'DataFrame | Series',
    how: 'str' = 'inner',
    on: 'IndexLabel | None' = None,
    left_on: 'IndexLabel | None' = None,
    right_on: 'IndexLabel | None' = None,
    left_index: 'bool' = False,
    right_index: 'bool' = False,
    sort: 'bool' = False,
    suffixes: 'Suffixes' = ('_x', '_y'),
    copy: 'bool' = True,
    indicator: 'bool' = False,
    validate: 'str | None' = None,
) -> 'DataFrame'

  • left:左表
  • right:右表
  • how:关联的方式,{‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}, 默认关联方式为 ‘inner’
  • on:关联时指定的字段,两个表共有的
  • left_on:关联时用到左表中的字段,在两个表不共有关联字段时使用
  • right_on:关联时用到右表中的字段,在两个表不共有关联字段时使用

以上参数在实际工作中经常使用,其他参数不再做介绍

案例:

图片

数据关联

merge 的使用与SQL中的 join 很像,使用方式基本一致,既有内连接,也有外连接,用起来基本没有什么难度

两者区别

  • concat 只是 pandas 下的方法,而 merge 即是 pandas 下的方法,又是DataFrame 下的方法
  • concat 可以横向、纵向拼接,又起到关联的作用
  • merge 只能进行关联,也就是纵向拼接
  • concat 可以同时处理多个数据框DataFrame,而 merge 只能同时处理 2 个数据框

到此这篇关于一次性彻底讲透Python中pd.concat与pd.merge的文章就介绍到这了,更多相关Python pd.concat与pd.merge内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
  • 详解pandas数据合并与重塑(pd.concat篇)

相关文章

  • 一次性彻底讲透Python中pd.concat与pd.merge

    一次性彻底讲透Python中pd.concat与pd.merge

    目录数据拼接:pd.concat数据关联:pd.merge两者区别数据的合并与关联是数据处理过程中经常遇到的问题,在SQL、HQL中大家可能都有用到 join、
    2022-06-15
  • Python利用PyAutoGUI模块实现控制鼠标键盘

    Python利用PyAutoGUI模块实现控制鼠标键盘

    目录前言1、鼠标的相关控制2、键盘的相关控制前言 PyAutoGUI是一个简单易用,跨平台的可以模拟键盘鼠标进行自动操作的python库。 使用pip的方
    2022-06-15
  • 详解Android中motion_toast的使用

    详解Android中motion_toast的使用

    目录前言motion_toast 介绍示例最简单用法其他内置的提醒自定义 toast总结前言 我们通常会用 toast(也叫吐司)来显示提示信息,例如网络请求
    2022-06-15
  • Element如何实现loading的方法示例

    Element如何实现loading的方法示例

    目录前言使用 loading 的几种方式loading 指令实现指令通过指令来创建 loading代码实现directive创建 loading 实例loading 动画其他 loading
    2022-06-15
  • PTC Creo Schematics 9.0.0.0 中文授权激活版 Win64

    PTC Creo Schematics 9.0.0.0 中文授权激活版 Win64

    PTC Creo Schematics 9.0.0.0 中文授权激活版 Win64,PTC Creo Schematics 9.0中文破解版是一款领先的布线图软件,用于创建布线系统(如电缆、管道、HVAC 和液压系统)的 2D 示意图。该软件可根据 Creo Parametric 和 Creo Elements/Direct 中的现有 2D 原理图自动创建详细的 3D 布线系统设计
    2022-06-11
  • Adobe Substance 3D Designer 2021 V12.1.1 中文/英文破解版(附安装教程)

    Adobe Substance 3D Designer 2021 V12.1.1 中文/英文破解版(附安装教程)

    Adobe Substance 3D Designer 2021 V12.1.1 中文/英文破解版(附安装教程),Substance 3D Designer 2021是一个Adobe发布Substance 3D系列创作软件之一,可创建无缝的素材和图案、图像滤镜、环境光,甚至 3D 模型,是大多数电子游戏和视觉效果素材管道所用的核心工具,这里提供最新中文英文版下载
    2022-06-11
  • Android开发手册自定义Switch开关按钮控件

    Android开发手册自定义Switch开关按钮控件

    目录??自定义Switch外观布局样式Drawable代码??自定义Switch外观 外观定制这块属于基操了,我们利用属性 android:track 和 android:thumb 定
    2022-06-11
  • Spring JPA 增加字段执行异常问题及解决

    Spring JPA 增加字段执行异常问题及解决

    目录Spring JPA 增加字段执行异常JPA自增字段自动添加报错“error performing isolated work”正确做法是使用 Spring JPA 增加字
    2022-06-11
  • 详解Spring Bean的配置方式与实例化

    详解Spring Bean的配置方式与实例化

    目录一、 Spring Bean 配置方式配置文件开发注解开发二、Spring Bean实例化环境准备构造方法实例化Bean静态工厂实例化Bean实例工厂实例化Bea
    2022-06-11
  • python中filter,map,reduce的作用

    python中filter,map,reduce的作用

    目录一、map函数1. lambda函数2. 自定义函数二、filter函数1. lambda函数2. 自定义函数三、reduce函数1. lambda函数2. 自定义函数一、map函数
    2022-06-11

最新评论