Spaces:

asach
/

arxiv-plagiarism-checker-Ilm

Runtime error

gamingflexer commited on Jan 17, 2024

Commit

59a1246

1 Parent(s): 424c175

Refactor

Files changed (2) hide show

src/scrapper/extractor.py CHANGED Viewed

@@ -1,5 +1,6 @@
 from langchain_community.chat_models import ChatOpenAI
-from langchain import PromptTemplate, LLMChain
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 import tiktoken
 from typing import Union

 from langchain_community.chat_models import ChatOpenAI
+from langchain.prompts import PromptTemplate
+from langchain.chains import LLMChain
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 import tiktoken
 from typing import Union

src/scrapper/main.py CHANGED Viewed

@@ -3,6 +3,7 @@ from scrapper.arxiv import get_paper_id,Arxiv
 from scrapper.extractor import get_google_scrape,init_extractor
 from tqdm import tqdm
 import os
 class ArxivPaper:
@@ -33,6 +34,7 @@ class ArxivPaper:
     def get_paper_details_batch(self, paper_ids: list, path: str = "./data/papers"):
         path_author = os.path.join(path, self.author_name.replace(" ", "_"))
         for i in tqdm(paper_ids):
             paper = Arxiv(i)
             paper.load()
@@ -41,4 +43,5 @@ class ArxivPaper:
             extractor=self.extractor,
             text_splitter=self.text_splitter,)
             paper.chunker()
-            paper.save_chunks(include_metadata=True, path=path_author)

 from scrapper.extractor import get_google_scrape,init_extractor
 from tqdm import tqdm
 import os
+from config import OPENAI_API_KEY
 class ArxivPaper:
     def get_paper_details_batch(self, paper_ids: list, path: str = "./data/papers"):
         path_author = os.path.join(path, self.author_name.replace(" ", "_"))
+        data = {}
         for i in tqdm(paper_ids):
             paper = Arxiv(i)
             paper.load()
             extractor=self.extractor,
             text_splitter=self.text_splitter,)
             paper.chunker()
+            paper.save_chunks(include_metadata=True, path=path_author)