Spaces:

perezcatriel
/

data_world_jobs

Runtime error

App Files Files Community

perezcatriel commited on Apr 26, 2023

Commit

74b1fdc

1 Parent(s): 5788134

spot youtube

Browse files

Files changed (4) hide show

ML/dataset_modelo_1.csv +0 -0
ML/salary.py +5 -2
ML/skill_top.py +26 -9
app.py +41 -1

ML/dataset_modelo_1.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

ML/salary.py CHANGED Viewed

@@ -7,10 +7,14 @@ from sklearn.ensemble import RandomForestRegressor
 df = pd.read_csv('./ds_salaries.csv')
 df = df[['company_location', 'salary_in_usd']]
 # Codificar las ubicaciones de las empresas
 le = LabelEncoder()
 df['company_location'] = le.fit_transform(df['company_location'])
 # Separar los datos de entrada y salida
 X = df.iloc[:, :-1].values
 y = df.iloc[:, -1].values
@@ -25,8 +29,7 @@ predicted_salaries = model.predict(locations.reshape(-1, 1))
 results_df = pd.DataFrame({'company_location': locations, 'predicted_salary': predicted_salaries})
 # Decodificar las ubicaciones de las empresas
-decoded_locations = le.inverse_transform(locations)
-results_df['company_location'] = decoded_locations
 # Ordenar los resultados por salario predicho
 results_df = results_df.sort_values('predicted_salary', ascending=False).reset_index(drop=True)

 df = pd.read_csv('./ds_salaries.csv')
 df = df[['company_location', 'salary_in_usd']]
 # Codificar las ubicaciones de las empresas
 le = LabelEncoder()
 df['company_location'] = le.fit_transform(df['company_location'])
+# Decodificar las ubicaciones de las empresas
+decoded_locations = le.inverse_transform(df['company_location'].unique())
 # Separar los datos de entrada y salida
 X = df.iloc[:, :-1].values
 y = df.iloc[:, -1].values
 results_df = pd.DataFrame({'company_location': locations, 'predicted_salary': predicted_salaries})
 # Decodificar las ubicaciones de las empresas
+results_df['company_location'] = le.inverse_transform(results_df['company_location'])
 # Ordenar los resultados por salario predicho
 results_df = results_df.sort_values('predicted_salary', ascending=False).reset_index(drop=True)

ML/skill_top.py CHANGED Viewed

@@ -4,7 +4,7 @@ from sklearn.feature_extraction.text import CountVectorizer
 from sklearn.naive_bayes import MultinomialNB
 # Cargar los datos
-df = pd.read_csv('../assets/dataset_modelo_1.csv')
 # Crear una lista con todas las skills disponibles
 all_skills = set()
@@ -47,13 +47,30 @@ def get_top_skills(title, limit):
     skill_freq_dict = dict(zip(skill_names, skill_frequencies))
     # Ordenar las habilidades por frecuencia descendente y devolver las más importantes (según el límite dado)
-    top_skills = sorted(skill_freq_dict, key=skill_freq_dict.get,
-                        reverse=True)[:limit]
-    return top_skills
 if title:
-    limit = st.number_input("Cantidad de habilidades a mostrar", value=5, min_value=1, max_value=len(all_skills))
-    top_skills = get_top_skills(title, limit)
-    st.write(f"Las {limit} habilidades más importantes para el trabajo de '{title}' son:")
-    for skill in top_skills:
-        st.write(f"- {skill}")

 from sklearn.naive_bayes import MultinomialNB
 # Cargar los datos
+df = pd.read_csv('./dataset_modelo_1.csv')
 # Crear una lista con todas las skills disponibles
 all_skills = set()
     skill_freq_dict = dict(zip(skill_names, skill_frequencies))
     # Ordenar las habilidades por frecuencia descendente y devolver las más importantes (según el límite dado)
+    top_skills_high = sorted(skill_freq_dict, key=skill_freq_dict.get,
+                             reverse=True)[:limit]
+    # Ordenar las habilidades por frecuencia ascendente y devolver las menos importantes (según el límite dado)
+    top_skills_low = sorted(skill_freq_dict, key=skill_freq_dict.get)[:limit]
+    return top_skills_high, top_skills_low
 if title:
+    limit = st.number_input("Cantidad de habilidades a mostrar", value=5,
+                            min_value=1, max_value=len(all_skills))
+    top_skills_high, top_skills_low = get_top_skills(title, limit)
+    col1, col2 = st.columns(2)
+    with col1:
+        st.write(
+            f"Las {limit} habilidades más importantes para el trabajo de '{title}' son:")
+        for skill in top_skills_high:
+            st.write(f"- {skill}")
+    with col2:
+        st.write(
+            f"Las {limit} habilidades menos importantes para el trabajo de '{title}' son:")
+        for skill in top_skills_low:
+            st.write(f"- {skill}")

app.py CHANGED Viewed

@@ -6,6 +6,7 @@ import pandas as pd
 import streamlit as st
 from PIL import Image
 from sklearn.linear_model import LinearRegression
 from streamlit_option_menu import option_menu
 # from streamlit.components.v1 import IFrame
@@ -94,6 +95,42 @@ if selected2 == "Home":
             ''', unsafe_allow_html=True)
     st.image(scrum)
     # st.image(logo, width=700)
     st.markdown('''
                     <br>
@@ -136,7 +173,7 @@ if selected2 == "Home":
         <hr>
     """, unsafe_allow_html=True)
-    col1, col2, col3 = st.columns(3)
     col1.markdown("""
     <a href="https://github.com/LRascon/data_world_jobs">Github</a>
     """, unsafe_allow_html=True)
@@ -148,6 +185,9 @@ if selected2 == "Home":
         /DashboardVistazoelMercadoActual?:language=es-ES&publish=yes
         &:display_count=n&:origin=viz_share_link">Tableau</a>
         """, unsafe_allow_html=True)
 # Pagina Projects
 if selected2 == "Análisis":

 import streamlit as st
 from PIL import Image
 from sklearn.linear_model import LinearRegression
+from streamlit.components.v1 import components
 from streamlit_option_menu import option_menu
 # from streamlit.components.v1 import IFrame
             ''', unsafe_allow_html=True)
     st.image(scrum)
+    #####
+    st.markdown("""
+    <br>
+    <h3>LatamBrain - Spot</h3>
+    <hr>
+    """, unsafe_allow_html=True)
+    VIDEO_ID = "VIDEO_ID"
+    # Genera el código HTML del iframe
+    html = f"""
+            <div >
+                <iframe
+                    style="height:200px;width
+                    :700px"
+                    width="530"
+                    height="360"
+                    src="https://www.youtube.com/embed/G8PdiAwhbNM"
+                    title="LatamBrain - Spot"
+                    frameborder="0"
+                    allow="accelerometer; autoplay; clipboard-write;
+                    encrypted-media; gyroscope;
+                    picture-in-picture; web-share"
+                    allowfullscreen
+                    >
+                </iframe>
+            </div>
+                """
+    # Inserta el iframe en la aplicación de Streamlit
+    st.components.v1.html(html)
+    #####
     # st.image(logo, width=700)
     st.markdown('''
                     <br>
         <hr>
     """, unsafe_allow_html=True)
+    col1, col2, col3, col4 = st.columns(4)
     col1.markdown("""
     <a href="https://github.com/LRascon/data_world_jobs">Github</a>
     """, unsafe_allow_html=True)
         /DashboardVistazoelMercadoActual?:language=es-ES&publish=yes
         &:display_count=n&:origin=viz_share_link">Tableau</a>
         """, unsafe_allow_html=True)
+    col4.markdown("""
+        <a href="https://www.youtube.com/watch?v=G8PdiAwhbNM">YouTube</a>
+        """, unsafe_allow_html=True)
 # Pagina Projects
 if selected2 == "Análisis":