Spaces:

3morrrrr
/

Schedule_App

Sleeping

App Files Files Community

Schedule_App / helper.py

3morrrrr

Update helper.py

9219e07 verified 3 months ago

raw

history blame contribute delete

6.8 kB

	import os
	import pandas as pd
	import random
	import re
	from sklearn.preprocessing import MinMaxScaler

	# Function to assign main accounts
	def assign_main_accounts(creators_file, chatter_files):
	creators = pd.read_excel(creators_file)
	creators.columns = creators.columns.str.strip()

	# Debugging: Check initial columns
	print("DEBUG: Initial Columns in Creator File:", creators.columns)

	# Standardize column names
	column_mapping = {
	"Creator": "Creator",
	"Total earnings": "Total earnings",
	"Subscription": "Subscription",
	"Active Fans": "ActiveFans",
	"Total active fans": "ActiveFans",
	}
	creators.rename(columns={k: v for k, v in column_mapping.items() if k in creators.columns}, inplace=True)

	# Debugging: Check renamed columns
	print("DEBUG: Renamed Columns in Creator File:", creators.columns)

	required_columns = ["Creator", "Total earnings", "Subscription", "ActiveFans"]
	missing_columns = [col for col in required_columns if col not in creators.columns]
	if missing_columns:
	raise KeyError(f"Missing required columns in creators file: {missing_columns}")

	# Process creators file
	creators["Total earnings"] = creators["Total earnings"].replace("[\$,]", "", regex=True).astype(float)
	creators["Subscription"] = creators["Subscription"].replace("[\$,]", "", regex=True).astype(float)
	creators["ActiveFans"] = pd.to_numeric(creators["ActiveFans"], errors="coerce").fillna(0)

	# Normalize data
	scaler = MinMaxScaler()
	creators[["Earnings_Normalized", "Subscriptions_Normalized"]] = scaler.fit_transform(
	creators[["Total earnings", "Subscription"]]
	)
	creators["Penalty Factor"] = 1 - abs(creators["Earnings_Normalized"] - creators["Subscriptions_Normalized"])
	creators["Score"] = (
	0.7 * creators["Earnings_Normalized"] + 0.3 * creators["Subscriptions_Normalized"]
	) * creators["Penalty Factor"]
	creators["Rank"] = creators["Score"].rank(ascending=False)
	creators = creators.sort_values(by="Rank").reset_index(drop=True)

	processed_creator_file = creators[["Creator", "ActiveFans"]]

	updated_chatter_files = []
	for chatter_file in chatter_files:
	chatters = pd.read_excel(chatter_file)
	chatters.columns = chatters.columns.str.strip()
	if len(chatters) > len(creators):
	raise ValueError("Not enough creators to assign to all chatters.")

	# Assign creators to chatters
	chatters["Main Account"] = creators.iloc[:len(chatters)]["Creator"].values
	updated_chatter_files.append(chatters)

	# Combine all updated chatter files into a single DataFrame
	combined_assignments = pd.concat(updated_chatter_files, ignore_index=True)

	return updated_chatter_files, processed_creator_file, combined_assignments




	def save_processed_files(assignments, output_dir):
	"""
	Save processed chatter files to the output directory.
	"""
	for idx, (shift, data) in enumerate(assignments.items()):
	output_file = os.path.join(output_dir, f"Updated_{shift.lower()}_file.xlsx")
	data.to_excel(output_file, index=False)
	print(f"Saved {shift} file to {output_file}")


	# Function to clean chatter data
	def clean_chatter_data(chatter_data):
	"""
	Clean and prepare chatter data for scheduling.
	"""
	required_columns = ["Name", "Main Account", "Final Rating", "Available Work Days"]
	for col in required_columns:
	if col not in chatter_data.columns:
	raise KeyError(f"Missing required column in chatter data: {col}")

	chatter_data["WorkDays"] = pd.to_numeric(chatter_data.get("Available Work Days", 6), errors="coerce").fillna(6).astype(int)
	chatter_data["Desired Off Day"] = chatter_data["Desired Off Day"].fillna("").apply(
	lambda x: [day.strip().capitalize() for day in re.split(r"[ ,]+", x) if day.strip()]
	)

	return chatter_data


	# Function to create a blank schedule template
	def create_schedule_template(account_data):
	"""
	Create a blank schedule template with required columns.
	"""
	if "Creator" not in account_data.columns or "ActiveFans" not in account_data.columns:
	raise KeyError("Account data must contain 'Creator' and 'ActiveFans' columns.")

	schedule_template = account_data[["Creator", "ActiveFans"]].copy()
	for day in ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday", "Sunday"]:
	schedule_template[day] = None

	return schedule_template


	# Function to assign main accounts to the schedule
	def assign_main_accounts_to_schedule(schedule, chatter_data):
	"""
	Assign main accounts to the schedule based on chatter data.
	"""
	for _, chatter in chatter_data.iterrows():
	main_account = chatter["Main Account"]
	if main_account in schedule["Creator"].values:
	idx = schedule[schedule["Creator"] == main_account].index[0]
	for day in schedule.columns[2:]:
	schedule.at[idx, day] = chatter["Name"]

	return schedule


	# Function to assign off days
	def assign_off_days(schedule, chatter_data):
	"""
	Assign days off for each chatter based on their 'Desired Off Day' field.
	"""
	for _, chatter in chatter_data.iterrows():
	for off_day in chatter["Desired Off Day"]:
	if off_day in schedule.columns[2:]:
	schedule.loc[schedule[off_day] == chatter["Name"], off_day] = None
	return schedule


	# Function to randomly fill schedule slots
	def randomly_fill_slots(schedule, chatter_data, max_accounts_per_day=3, max_fans_per_day=1000):
	"""
	Randomly fill remaining slots in the schedule while respecting constraints.
	"""
	days_of_week = ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday", "Sunday"]
	chatters_list = chatter_data["Name"].tolist()

	for day in days_of_week:
	for idx, row in schedule.iterrows():
	if pd.isnull(schedule.at[idx, day]):
	random.shuffle(chatters_list)
	for chatter in chatters_list:
	schedule.at[idx, day] = chatter
	break

	return schedule


	# Main schedule generation function
	def generate_schedule(chatter_files, account_data):
	schedules = {}
	shift_names = ["Overnight", "Day", "Prime"]

	for idx, chatter_df in enumerate(chatter_files):
	shift_name = shift_names[idx]
	chatter_df = clean_chatter_data(chatter_df)
	schedule = create_schedule_template(account_data)
	schedule = assign_main_accounts_to_schedule(schedule, chatter_df)
	schedule = assign_off_days(schedule, chatter_df)
	schedule = randomly_fill_slots(schedule, chatter_df)
	schedules[shift_name] = schedule

	return schedules