Python将dataframe中的字符串日期转化为日期的方法
方法一:也是最简单的
直接使用pd.to_datetime函数实现
1
|
data['交易时间']=pd.to_datetime(data['交易时间'])
|
方法二:
源自利用python进行数据分析P304
使用python的datetime包中的
strptime函数,datetime.strptime(value,'%Y/%M/%D')
strftime函数,datetime.strftime(‘%Y/%M/%D')
注意使用datetime包中后面的字符串匹配需要和原字符串的格式相同,才能转义过来,相当于yyyy-mm-dd格式的需要按照'%Y-%M-%D'来实现,而不是'%Y/%M/%D'
1
|
data['交易时间']=data['交易时间'].apply(lambdax:datetime.strptime(x,'%Y-%m-%d %H:%M:%S'))
|
注意到上面代码的'%Y-%m-%d %H:%M:%S'嘛?
这里的格式必须与原数值的格式一模一样才能转换,如果原数值里面是精确到时分秒的,那么你此处不写%H:%M:%S就没办法转换!!!切记
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
|
'''
获取指定日期的上个月
日期字符串和日期格式
'''
defgetLastMonth(dtstr,dateformat):
d=datetime.strptime(dtstr, dateformat).date()
year=d.year
month=d.month
ifmonth==1:#如果是本年1月的
month=12
year-=1
else:#如果是大于1月的
month-=1
return(datetime(year,month,1)).strftime(dateformat)
'''
两个日期之间相差的月数
包括开始日期和结束日期的当天
日期字符串和日期格式
'''
defdiffMonth(startDate,endDate,dateformat):
start=datetime.strptime(startDate, dateformat).date()
end=datetime.strptime(endDate, dateformat).date()
startYear=start.year
startMonth=start.month
endYear=end.year
endMonth=end.month
#如果是同年
ifstartYear==endYear:
diffmonths=endMonth-startMonth
#如果是上年
elifendYear-startYear==1:
diffmonths=12+endMonth-startMonth
#如果是大于1年
elifendYear-startYear>1:
years=endYear-startYear
diffmonths=(years-1)*12+12+endMonth-startMonth
#如果开始日期大约结束日期报错
elifendYear-startYear<0or( endYear==startYearandendMonth-startMonth):
print'enddate must greater than startdate'
returnint(diffmonths+1)
|