Python数据分析

Python数据分析 知识量:13 - 56 - 232

3.1 Series数据结构><

什么是Series- 3.1.1 -

pandas模块具有两种主要的数据结构:

  • Series

  • DataFrame

其中,Series数据结构类似于NumPy的一维数组对象,由一组数据和索引组成。下面是一个Series数据结构的示例:

0    a
1    b
2    c
dtype: object

第一列0~2称为索引或数据标签;第二列a~c是真正的数据。索引与数据一一对应。

创建Series数据- 3.1.2 -

1、使用pd.Serise()函数来创建Series数据对象,参数可以为一个列表:

import pandas as pd
ss=pd.Series(['a','b','c'])
print(ss)

运行结果为:

0    a
1    b
2    c
dtype: object

2、指定索引。

不指定索引的话,Series数据对象默认以0开始。也可以通过设置index参数指定索引:

import pandas as pd
ss=pd.Series(['a','b','c'],index=[4,5,6])
print(ss)

运行结果为:

4    a
5    b
6    c
dtype: object

3、利用字典创建Series数据对象。

可以将一个字典作为参数传给Serise()函数,字典的key值将成为索引,value值将成为数据值。

import pandas as pd
dic={1:'apple',2:'pear',3:'banana'}
ss=pd.Series(dic)
print(ss)

运行结果为:

1     apple
2      pear
3    banana
dtype: object

获取Series的索引- 3.1.3 -

使用index方法获取Series对象的所有索引。对于默认索引和指定索引创建的数据对象,显示结果有所不同。

import pandas as pd
ss=pd.Series(['a','b','c'])
print(ss.index)
ss=pd.Series(['a','b','c'],index=[4,5,6])
print(ss.index)
dic={1:'apple',2:'pear',3:'banana'}
ss=pd.Series(dic)
print(ss.index)

运行结果为:

RangeIndex(start=0, stop=3, step=1)
Int64Index([4, 5, 6], dtype='int64')
Int64Index([1, 2, 3], dtype='int64')

获取Series的值- 3.1.4 -

使用values方法获取Series对象的所有值。

import pandas as pd
ss=pd.Series(['a','b','c'])
print(ss.values)
ss=pd.Series(['a','b','c'],index=[4,5,6])
print(ss.values)
dic={1:'apple',2:'pear',3:'banana'}
ss=pd.Series(dic)
print(ss.values)

运行结果为:

['a' 'b' 'c']
['a' 'b' 'c']
['apple' 'pear' 'banana']

使用下标取值- 3.1.5 -

除了使用values方法获取Series对象的所有值以外,完全可以像数组那样,通过下标获得其某个值。

import pandas as pd
dic={1:'apple',2:'pear',3:'banana'}
ss=pd.Series(dic)
print(ss[2])

运行结果为:

pear