我试着把一个月分成几周,有些月可能有4周,有些可能有5周。对于每一天,我想知道它属于哪一周。我最感兴趣的是这个月的最后一周。
data = pd.DataFrame(pd.date_range(' 1/ 1/ 2000', periods = 100, freq ='D')) 0 2000-01-01 1 2000-01-02 2 2000-01-03 3 2000-01-04 4 2000-01-05 5 2000-01-06 6 2000-01-07
v64noz0r1#
查看此answer并决定您要在一个月中的哪一周使用。没有内置的,所以你需要用apply来计算它。例如,为了简单地测量“已经过了多少个7天的周期”。
data['wom'] = data[0].apply(lambda d: (d.day-1) // 7 + 1)
对于更复杂的(基于日历),使用该答案中的函数。
import datetime import calendar def week_of_month(tgtdate): tgtdate = tgtdate.to_datetime() days_this_month = calendar.mdays[tgtdate.month] for i in range(1, days_this_month): d = datetime.datetime(tgtdate.year, tgtdate.month, i) if d.day - d.weekday() > 0: startdate = d break # now we canuse the modulo 7 appraoch return (tgtdate - startdate).days //7 + 1 data['calendar_wom'] = data[0].apply(week_of_month)
d8tt03nd2#
我在处理具有datetime索引的 Dataframe 时使用了下面的代码。
import pandas as pd import math def add_week_of_month(df): df['week_in_month'] = pd.to_numeric(df.index.day/7) df['week_in_month'] = df['week_in_month'].apply(lambda x: math.ceil(x)) return df
如果运行此示例:
df = test = pd.DataFrame({'count':['a','b','c','d','e']}, index = ['2018-01-01', '2018-01-08','2018-01-31','2018-02-01','2018-02-28']) df.index = pd.to_datetime(df.index)
您应该获得以下 Dataframe
count week_in_month 2018-01-01 a 1 2018-01-08 b 2 2018-01-31 c 5 2018-02-01 d 1 2018-02-28 e 4
wfveoks03#
import pandas as pd def weekinmonth(dates): """Get week number in a month. Parameters: dates (pd.Series): Series of dates. Returns: pd.Series: Week number in a month. """ firstday_in_month = dates - pd.to_timedelta(dates.dt.day - 1, unit='d') return (dates.dt.day-1 + firstday_in_month.dt.weekday) // 7 + 1 df = pd.DataFrame(pd.date_range(' 1/ 1/ 2000', periods = 100, freq ='D'), columns=['Date']) weekinmonth(df['Date'])
0 1 1 1 2 2 3 2 4 2 .. 95 2 96 2 97 2 98 2 99 2 Name: Date, Length: 100, dtype: int64
首先,计算每月的第一天(根据以下答案:如何地板一个日期到该月的第一天?):一个二个一个一个从第一天获取工作日:
df['FirstWeekday'] = df['MonthFirstDay'].dt.weekday df
Date MonthFirstDay FirstWeekday 0 2000-01-01 2000-01-01 5 1 2000-01-02 2000-01-01 5 2 2000-01-03 2000-01-01 5 3 2000-01-04 2000-01-01 5 4 2000-01-05 2000-01-01 5 .. ... ... ... 95 2000-04-05 2000-04-01 5 96 2000-04-06 2000-04-01 5 97 2000-04-07 2000-04-01 5 98 2000-04-08 2000-04-01 5 99 2000-04-09 2000-04-01 5 [100 rows x 3 columns]
现在我可以用工作日的模来计算一个月的周数:1.通过df['Date'].dt.day获得月份的日期,并确保由于模计算df['Date'].dt.day-1而从0开始。1.添加工作日编号,以确保每月的哪一天开始+ df['FirstWeekday']1.安全的做法是使用整数除法,将一周中的7天除以1,然后从1 // 7 + 1开始添加1作为月份中的周数。全模计算:
df['Date'].dt.day
df['Date'].dt.day-1
+ df['FirstWeekday']
// 7 + 1
df['WeekInMonth'] = (df['Date'].dt.day-1 + df['FirstWeekday']) // 7 + 1 df
Date MonthFirstDay FirstWeekday WeekInMonth 0 2000-01-01 2000-01-01 5 1 1 2000-01-02 2000-01-01 5 1 2 2000-01-03 2000-01-01 5 2 3 2000-01-04 2000-01-01 5 2 4 2000-01-05 2000-01-01 5 2 .. ... ... ... ... 95 2000-04-05 2000-04-01 5 2 96 2000-04-06 2000-04-01 5 2 97 2000-04-07 2000-04-01 5 2 98 2000-04-08 2000-04-01 5 2 99 2000-04-09 2000-04-01 5 2 [100 rows x 4 columns]
yrwegjxp4#
这似乎对我有用
df_dates = pd.DataFrame({'date':pd.bdate_range(df['date'].min(),df['date'].max())}) df_dates_tues = df_dates[df_dates['date'].dt.weekday==2].copy() df_dates_tues['week']=np.mod(df_dates_tues['date'].dt.strftime('%W').astype(int),4)
pxyaymoc5#
你可以得到它减去当前周和一个月的第一天所在的周,但是需要额外的逻辑来处理一年的第一周和最后一周:
def get_week(s): prev_week = (s - pd.to_timedelta(7, unit='d')).dt.week return ( s.dt.week .where((s.dt.month != 1) | (s.dt.week < 50), 0) .where((s.dt.month != 12) | (s.dt.week > 1), prev_week + 1) ) def get_week_of_month(s): first_day_of_month = s - pd.to_timedelta(s.dt.day - 1, unit='d') first_week_of_month = get_week(first_day_of_month) current_week = get_week(s) return current_week - first_week_of_month
cqoc49vn6#
我得到一个月中的星期的逻辑取决于一年中的星期。1.在数据框中计算一年中的第一周1.如果月份不为1,则获取上一年的最大周月份,如果月份为1,则返回一年中的周1.如果上个月的最大周等于当前月的最大周1.然后返回一年中当前周与前一个月的最大周加1的差值1.否则返回一年中当前周与上个月最大周的差值希望这能解决上面使用的多个逻辑存在局限性的问题,下面的函数也是如此。这里的Temp是使用dt.weekofyear计算一年中某周的 Dataframe
def weekofmonth(dt1): if dt1.month == 1: return (dt1.weekofyear) else: pmth = dt1.month - 1 year = dt1.year pmmaxweek = temp[(temp['timestamp_utc'].dt.month == pmth) & (temp['timestamp_utc'].dt.year == year)]['timestamp_utc'].dt.weekofyear.max() if dt1.weekofyear == pmmaxweek: return (dt1.weekofyear - pmmaxweek + 1) else: return (dt1.weekofyear - pmmaxweek)
u4vypkhs7#
import pandas as pd import math def week_of_month(dt:pd.Timestamp): return math.ceil((x-1)//7)+1 dt["what_you_need"] = df["dt_col_name"].apply(week_of_month)
这给你一周从1-5,如果天〉28,那么它将被算作第5周。
7条答案
按热度按时间v64noz0r1#
查看此answer并决定您要在一个月中的哪一周使用。
没有内置的,所以你需要用apply来计算它。例如,为了简单地测量“已经过了多少个7天的周期”。
对于更复杂的(基于日历),使用该答案中的函数。
d8tt03nd2#
我在处理具有datetime索引的 Dataframe 时使用了下面的代码。
如果运行此示例:
您应该获得以下 Dataframe
wfveoks03#
靶区; DR
解释
首先,计算每月的第一天(根据以下答案:如何地板一个日期到该月的第一天?):
一个二个一个一个
从第一天获取工作日:
现在我可以用工作日的模来计算一个月的周数:
1.通过
df['Date'].dt.day
获得月份的日期,并确保由于模计算df['Date'].dt.day-1
而从0开始。1.添加工作日编号,以确保每月的哪一天开始
+ df['FirstWeekday']
1.安全的做法是使用整数除法,将一周中的7天除以1,然后从1
// 7 + 1
开始添加1作为月份中的周数。全模计算:
yrwegjxp4#
这似乎对我有用
pxyaymoc5#
你可以得到它减去当前周和一个月的第一天所在的周,但是需要额外的逻辑来处理一年的第一周和最后一周:
cqoc49vn6#
我得到一个月中的星期的逻辑取决于一年中的星期。
1.在数据框中计算一年中的第一周
1.如果月份不为1,则获取上一年的最大周月份,如果月份为1,则返回一年中的周
1.如果上个月的最大周等于当前月的最大周
1.然后返回一年中当前周与前一个月的最大周加1的差值
1.否则返回一年中当前周与上个月最大周的差值
希望这能解决上面使用的多个逻辑存在局限性的问题,下面的函数也是如此。这里的Temp是使用dt.weekofyear计算一年中某周的 Dataframe
u4vypkhs7#
这给你一周从1-5,如果天〉28,那么它将被算作第5周。