import streamlit as st
import google.generativeai as genai
from PIL import Image
from gtts import gTTS
import os
from googletrans import Translator

# Google Gemini API anahtarınızı yapılandırın
genai.configure(api_key='AIzaSyDbYPJa5rj_MMMEcSbl86J9Uq98s-Ioxvk')

# Çeviri için Translator nesnesi oluşturun
translator = Translator()

# Streamlit başlık
st.title('Analyze Image With Google Gemini')

# Yeni modeli tanımlayın (görsel analizi yapabilen model)
model = genai.GenerativeModel('gemini-1.5-flash')  # Önerilen model

# Fotoğraf çekme butonu
st.subheader('Kamera ile fotoğraf çekin veya bir görsel yükleyin')

# Kamera ile fotoğraf çekme bölümü
camera_photo = st.camera_input("Kamera ile Fotoğraf Çekin")

# Resim yükleme bölümü
resim = st.file_uploader('Bir Resim Yükleyin', type=['jpg', 'jpeg', 'png'])

# Görsel yüklenip yüklenmediğini kontrol et
new_image = None
if camera_photo:
    new_image = Image.open(camera_photo)
    st.image(new_image, caption='Kamera ile Çekilen Fotoğraf', use_column_width=True)
elif resim:
    new_image = Image.open(resim)
    st.image(new_image, caption='Yüklenen Görsel', use_column_width=True)

# Görselin değişip değişmediğini kontrol et
if 'current_image' in st.session_state:
    if st.session_state.current_image != new_image:
        st.session_state.current_image = new_image
        st.session_state.response_text = None  # Önceki yanıtı sıfırla
        st.session_state.translated_text = None  # Çevrilen metni sıfırla
else:
    if new_image:
        st.session_state.current_image = new_image
        st.session_state.response_text = None  # Önceki yanıtı sıfırla
        st.session_state.translated_text = None  # Çevrilen metni sıfırla

# Soru bölümü (Varsayılan: "Explain this image with details")
soru = st.text_input('Görsel hakkında ne sormak istersiniz?', value='Explain this image with details')

# Fonksiyon: Görsel analizi yapma ve ses dosyasını oluşturma
def analyze_and_speak(image, question, file_name):
    try:
        # Görsel ve soruyu modele iletmek
        response = model.generate_content([question, image], stream=True)
        response.resolve()
        st.session_state.response_text = response.text
        st.write(st.session_state.response_text)

        # Metni Türkçeye çevirme
        st.session_state.translated_text = translator.translate(st.session_state.response_text, dest='tr').text
        st.write(f"Türkçeye Çevrilen Metin: {st.session_state.translated_text}")

        # gTTS ile çevrilen metni sesli hale getirme (daha hızlı okuma için slow=False)
        tts = gTTS(text=st.session_state.translated_text, lang='tr', slow=False)
        file_path = file_name
        tts.save(file_path)
        
        # Dosyanın varlığını kontrol et
        if os.path.exists(file_path):
            st.success("Ses dosyası başarıyla kaydedildi!")

            # Ses dosyasını çal
            with open(file_path, "rb") as audio_file:
                audio_bytes = audio_file.read()
                st.audio(audio_bytes, format="audio/mp3")
        else:
            st.error("Ses dosyası oluşturulurken bir hata oluştu.")
    except Exception as e:
        st.error(f"Bir hata oluştu: {e}")

# Soru otomatik olarak çalıştırılsın (butona basmaya gerek kalmadan)
if new_image and st.session_state.response_text is None:
    analyze_and_speak(new_image, soru, "output_tr.mp3")

# Otomatik görsel analizi için buton
if st.button("Otomatik Görsel Analizi Yap"):
    if camera_photo:
        analyze_and_speak(new_image, 'What do you see here?', "output_auto_tr.mp3")
    else:
        st.error("Lütfen önce bir görsel yükleyin veya kamera ile fotoğraf çekin.")