下载链接:
https://alltodata.cowtransfer.com/s/b8aa2f26ca0947
读取数据:
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)
结果如下:
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)
x = (df["数学"]>=60) & (df["英语"]>=70)
display(x)
df1 = df[(df["数学"]>=60) & (df["英语"]>=70)]
display(df1)
结果如下:
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)
x = (df["语文"]<60) | (df["数学"]>80)
display(x)
df1 = df[(df["语文"]<60) | (df["数学"]>80)]
display(df1)
结果如下:
(这种方式很重要)
# 自己在原始数据中,任意删除三个值,重新读取即可
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)
x = df["语文"].isnull()
display(x)
y = ~df["语文"].isnull()
display(y)
df1 = df[~df["语文"].isnull()]
display(df1)
结果如下:
注意:isnull()判断某个值是否为空,如果是返回True,否则返回False。
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)
df1 = df.query("语文>=60")
df1
df1 = df.query("语文>=60 & 数学>=60")
df1
结果如下:
使用isin()函数,不仅可以针对整个df操作,也可以针对df中的某一列(Series)操作,但是针对Series的操作才是最常用的。
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)
df.isin(["60","70"])
结果如下:
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)
df["语文"].isin(["37","97"])
df1 = df[df["语文"].isin(["37","97"])]
display(df1)
结果如下:
df1 = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx",sheet_name=0)
display(df1)
df2 = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx",sheet_name=1)
display(df2)
x = df1["name"].isin(df2["name"])
display(x)
df1[df1["name"].isin(df2["name"])]
结果如下:
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx",sheet_name=0)
display(df)
df["数学"].between(50,70)
df[df["数学"].between(50,70)]
结果如下:
注意:此函数范围是左闭右闭区间。