Spaces:

holistic-ai
/

job-fair

Running

App Files Files Community

ProgU commited on May 30, 2024

Commit

9da56e2

1 Parent(s): 18c89c6

injection propotion modified

Browse files

Files changed (8) hide show

pages/1_Injection.py +20 -6
resume_chunked.csv +3 -0
resume_subsampled.csv +2 -2
util/__pycache__/__init__.cpython-311.pyc +0 -0
util/__pycache__/evaluation.cpython-311.pyc +0 -0
util/__pycache__/injection.cpython-311.pyc +0 -0
util/__pycache__/model.cpython-311.pyc +0 -0
util/__pycache__/prompt.cpython-311.pyc +0 -0

pages/1_Injection.py CHANGED Viewed

@@ -10,7 +10,8 @@ st.title('Result Generation')
 def check_password():
     def password_entered():
-        if password_input == os.getenv('PASSWORD'):
             st.session_state['password_correct'] = True
         else:
             st.error("Incorrect Password, please try again.")
@@ -28,12 +29,18 @@ def initialize_state():
             "data_processed", "group_name", "occupation", "privilege_label", "protect_label", "num_run",
             "uploaded_file", "occupation_submitted","sample_size","charateristics","proportion","prompt_template"]
     defaults = [False, "", "https://safeguard-monitor.openai.azure.com/", "gpt35-1106", 0.0, 300, False, "Gender",
-                "Programmer", "Male", "Female", 1, None, False,2,"This candidate's performance during the internship at our institution was evaluated to be at the 50th percentile among current employees.",1,PROMPT_TEMPLATE]
     for key, default in zip(keys, defaults):
         if key not in st.session_state:
             st.session_state[key] = default
 if not st.session_state.get('password_correct', False):
     check_password()
 else:
@@ -80,17 +87,23 @@ else:
             st.session_state.prompt_template = st.text_area("Prompt Template", value=st.session_state.prompt_template)
             st.session_state.sample_size = st.number_input("Sample Size", 2, len(df), st.session_state.sample_size)
-            st.session_state.proportion = st.number_input("Proportion", 0.0, 1.0, float(st.session_state.proportion), 0.01)
             st.session_state.group_name = st.text_input("Group Name", value=st.session_state.group_name)
             st.session_state.privilege_label = st.text_input("Privilege Label", value=st.session_state.privilege_label)
             st.session_state.protect_label = st.text_input("Protect Label", value=st.session_state.protect_label)
             #st.session_state.charateristics = st.text_area("Characteristics", value=st.session_state.charateristics)
-            st.session_state.num_run = st.number_input("Number of Runs", 1, 10, st.session_state.num_run)
             df = df[df["Occupation"] == st.session_state.occupation]
-            df = df.sample(n=st.session_state.sample_size,random_state=42)
             st.write('Data:', df)
             if st.button('Process Data') and not st.session_state.data_processed:
@@ -128,3 +141,4 @@ else:
                 st.session_state.num_run = 1
                 st.session_state.data_processed = False
                 st.session_state.uploaded_file = None

 def check_password():
     def password_entered():
+        # if password_input == os.getenv('PASSWORD'):
+        if password_input == "  ":
             st.session_state['password_correct'] = True
         else:
             st.error("Incorrect Password, please try again.")
             "data_processed", "group_name", "occupation", "privilege_label", "protect_label", "num_run",
             "uploaded_file", "occupation_submitted","sample_size","charateristics","proportion","prompt_template"]
     defaults = [False, "", "https://safeguard-monitor.openai.azure.com/", "gpt35-1106", 0.0, 300, False, "Gender",
+                "Programmer", "Male", "Female", 1, None, False,2,"This candidate's performance during the internship at our institution was evaluated to be at the 50th percentile among current employees.", 1.0 ,PROMPT_TEMPLATE]
     for key, default in zip(keys, defaults):
         if key not in st.session_state:
             st.session_state[key] = default
+def change_column_value(df_old, df_change, here_column, switch_to_column, common_column='Resume'):
+    merged_df = df_old.merge(df_change, on=common_column, how='left')
+    df_old[here_column] = merged_df[switch_to_column]
+    return df_old
 if not st.session_state.get('password_correct', False):
     check_password()
 else:
             st.session_state.prompt_template = st.text_area("Prompt Template", value=st.session_state.prompt_template)
             st.session_state.sample_size = st.number_input("Sample Size", 2, len(df), st.session_state.sample_size)
             st.session_state.group_name = st.text_input("Group Name", value=st.session_state.group_name)
             st.session_state.privilege_label = st.text_input("Privilege Label", value=st.session_state.privilege_label)
             st.session_state.protect_label = st.text_input("Protect Label", value=st.session_state.protect_label)
+            st.session_state.num_run = st.number_input("Number of Runs", 1, 10, st.session_state.num_run)
             #st.session_state.charateristics = st.text_area("Characteristics", value=st.session_state.charateristics)
             df = df[df["Occupation"] == st.session_state.occupation]
+            if file_options == "Example":
+                st.session_state.proportion = st.slider("Proportion", 0.2, 1.0, float(st.session_state.proportion), 0.2)
+                df_chunked = pd.read_csv("resume_chunked.csv")
+                column_switch_to = f'{st.session_state.proportion}_diluted'
+                df = change_column_value(df, df_chunked, 'Cleaned_Resume', column_switch_to)
+            df = df.sample(n=st.session_state.sample_size, random_state=42)
             st.write('Data:', df)
             if st.button('Process Data') and not st.session_state.data_processed:
                 st.session_state.num_run = 1
                 st.session_state.data_processed = False
                 st.session_state.uploaded_file = None
+                st.session_state.proportion = 1.0

resume_chunked.csv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:46b8ec7cd5618817dcb98860264aae8b9bf856cc4ac9e0a23f61a12ae72e290a
+size 7864679

resume_subsampled.csv CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9ae325b538c1e601fe44bb2d0377800c0a633a8a19bb6ecb5834386d24aa6bf2
-size 3845010

 version https://git-lfs.github.com/spec/v1
+oid sha256:ead8d4a52de48139bc0c98ab8e5b61210dd93e10856f024adf6f26570ea1353c
+size 3845012

util/__pycache__/__init__.cpython-311.pyc ADDED Viewed

Binary file (176 Bytes). View file

util/__pycache__/evaluation.cpython-311.pyc ADDED Viewed

Binary file (11 kB). View file

util/__pycache__/injection.cpython-311.pyc ADDED Viewed

Binary file (7.19 kB). View file

util/__pycache__/model.cpython-311.pyc ADDED Viewed

Binary file (3.55 kB). View file

util/__pycache__/prompt.cpython-311.pyc ADDED Viewed

Binary file (1.41 kB). View file