import pandas as pd
import numpy as np
import seaborn as sns


penguins = sns.load_dataset('penguins')
penguins.head()


penguins = penguins.dropna()
penguins.head()


penguins.dtypes

species               object
island                object
bill_length_mm       float64
bill_depth_mm        float64
flipper_length_mm    float64
body_mass_g          float64
sex                   object
dtype: object


penguins[['bill_length_mm', 'bill_depth_mm']] = penguins[['bill_length_mm', 'bill_depth_mm']].astype('int64')
penguins['sex'] = penguins['sex'].astype('bool')
penguins.dtypes

species               object
island                object
bill_length_mm         int64
bill_depth_mm          int64
flipper_length_mm    float64
body_mass_g          float64
sex                     bool
dtype: object


penguins.head()


data = {1:'a', 2:'b', 3:'c'}
s = pd.Series(data)
s

1    a
2    b
3    c
dtype: object


data = ['a','b','c']
index = [1,2,3]
s = pd.Series(data, index=index)
s

1    a
2    b
3    c
dtype: object


d = {
    "one": pd.Series([1.0, 2.0, 3.0], index=["a", "b", "c"]),
    "two": pd.Series([1.0, 2.0, 3.0, 4.0], index=["a", "b", "c", "d"]),
}
df = pd.DataFrame(d)
df


d = {"one": [1.0, 2.0, 3.0, 4.0], "two": [4.0, 3.0, 2.0, 1.0]}

pd.DataFrame(d)


d = [{"a": 1, "b": 2}, {"a": 5, "b": 10, "c": 20}]

pd.DataFrame(d)

	species	island	bill_length_mm	bill_depth_mm	flipper_length_mm	body_mass_g	sex
0	Adelie	Torgersen	39.1	18.7	181.0	3750.0	Male
1	Adelie	Torgersen	39.5	17.4	186.0	3800.0	Female
2	Adelie	Torgersen	40.3	18.0	195.0	3250.0	Female
3	Adelie	Torgersen	NaN	NaN	NaN	NaN	NaN
4	Adelie	Torgersen	36.7	19.3	193.0	3450.0	Female

	species	island	bill_length_mm	bill_depth_mm	flipper_length_mm	body_mass_g	sex
0	Adelie	Torgersen	39.1	18.7	181.0	3750.0	Male
1	Adelie	Torgersen	39.5	17.4	186.0	3800.0	Female
2	Adelie	Torgersen	40.3	18.0	195.0	3250.0	Female
4	Adelie	Torgersen	36.7	19.3	193.0	3450.0	Female
5	Adelie	Torgersen	39.3	20.6	190.0	3650.0	Male

	species	island	bill_length_mm	bill_depth_mm	flipper_length_mm	body_mass_g	sex
0	Adelie	Torgersen	39	18	181.0	3750.0	True
1	Adelie	Torgersen	39	17	186.0	3800.0	True
2	Adelie	Torgersen	40	18	195.0	3250.0	True
4	Adelie	Torgersen	36	19	193.0	3450.0	True
5	Adelie	Torgersen	39	20	190.0	3650.0	True

Working With Datetime In Pandas

Pandas data types¶

Numerical¶

String¶

Date¶

Boolean¶

Category¶

Lets see how these data types work¶

Convert data types¶

Data Structures (complex data types)¶

Pandas Series¶

Pandas DataFrame¶

	one	two
a	1.0	1.0
b	2.0	2.0
c	3.0	3.0
d	NaN	4.0

	one	two
0	1.0	4.0
1	2.0	3.0
2	3.0	2.0
3	4.0	1.0

	a	b	c
0	1	2	NaN
1	5	10	20.0