ruslanruslanruslan commited on
Commit
460cf27
1 Parent(s): b2d4d5f

README added

Browse files
Files changed (1) hide show
  1. README.md +44 -12
README.md CHANGED
@@ -1,12 +1,44 @@
1
- ---
2
- title: Nlp Project
3
- emoji: 🦀
4
- colorFrom: pink
5
- colorTo: purple
6
- sdk: streamlit
7
- sdk_version: 1.21.0
8
- app_file: app.py
9
- pinned: false
10
- ---
11
-
12
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ Проект в области обработки естественного языка
2
+
3
+ Целью проекта является создание мультистраничного приложения на платформе HuggingFace/Streamlit, демонстрирующего возможности и функционал ряда технологий машинного обучения и нейронных сетей в области обработки естественного языка.
4
+
5
+ Результатом проекта является приложение, состоящее из следующих компонентов:
6
+ 1. Классификатор коротких рецензий на фильмы на английском языке на базе трёх моделей:
7
+ (1) Классическая логистическая регрессия;
8
+ (2) Обученная сеть LSTM;
9
+ (3) Модель BERT с дообученными последними слоями трансформеров и добавленным линейным полносвязным слоем.
10
+ 2. Суммаризатор текстов на английском языке на базе модели BERT.
11
+ 3. Серия моделей GPT с настраиваемыми параметрами генерации, дообученных на текстах:
12
+ (1) Хорхе Луиса Борхеса;
13
+ (2) А.С. Пушкина;
14
+ (3) Oxxxymiron.
15
+
16
+ Проект выполнен участниками группы DS20 в составе:
17
+ - Артёма Дойникова,
18
+ - Сергея Карпенко,
19
+ - Александра Курчаткина,
20
+ - Руслана Султанова,
21
+ - Евгения Щуркина.
22
+
23
+
24
+ Natural Language Processing Project
25
+
26
+ The goal of the project is to create a multi-page application on HuggingFace / Streamlit in order to demonstrate some of the capabilities and functionality of a number of machine learning and neural networks technologies in the field of natural language processing.
27
+
28
+ The tangible result of the project is an application consisting of the following components:
29
+ 1. A classifier of short reviews of films in English based on three models:
30
+ (1) A classical logistic regression;
31
+ (2) A trained LSTM network;
32
+ (3) A BERT model with retrained last layers of transformers and an added linear fully-connected layer.
33
+ 2. Summarizer of texts in English based on the BERT model.
34
+ 3. A series of GPT models with customizable generation parameters, retrained on the texts of:
35
+ (1) Jorge Luis Borges;
36
+ (2) Alexander Pushkin;
37
+ (3) Oxxxymiron.
38
+
39
+ The project has been carried out by members of the DS20 group:
40
+ - Artyom Doinikov,
41
+ - Sergey Karpenko,
42
+ - Alexander Kurchatkin,
43
+ - Ruslan Sultanov,
44
+ - Evgeniy Shchurkin.