Spaces:
Sleeping
Sleeping
ruslanruslanruslan
commited on
Commit
•
460cf27
1
Parent(s):
b2d4d5f
README added
Browse files
README.md
CHANGED
@@ -1,12 +1,44 @@
|
|
1 |
-
|
2 |
-
|
3 |
-
|
4 |
-
|
5 |
-
|
6 |
-
|
7 |
-
|
8 |
-
|
9 |
-
|
10 |
-
|
11 |
-
|
12 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
Проект в области обработки естественного языка
|
2 |
+
|
3 |
+
Целью проекта является создание мультистраничного приложения на платформе HuggingFace/Streamlit, демонстрирующего возможности и функционал ряда технологий машинного обучения и нейронных сетей в области обработки естественного языка.
|
4 |
+
|
5 |
+
Результатом проекта является приложение, состоящее из следующих компонентов:
|
6 |
+
1. Классификатор коротких рецензий на фильмы на английском языке на базе трёх моделей:
|
7 |
+
(1) Классическая логистическая регрессия;
|
8 |
+
(2) Обученная сеть LSTM;
|
9 |
+
(3) Модель BERT с дообученными последними слоями трансформеров и добавленным линейным полносвязным слоем.
|
10 |
+
2. Суммаризатор текстов на английском языке на базе модели BERT.
|
11 |
+
3. Серия моделей GPT с настраиваемыми параметрами генерации, дообученных на текстах:
|
12 |
+
(1) Хорхе Луиса Борхеса;
|
13 |
+
(2) А.С. Пушкина;
|
14 |
+
(3) Oxxxymiron.
|
15 |
+
|
16 |
+
Проект выполнен участниками группы DS20 в составе:
|
17 |
+
- Артёма Дойникова,
|
18 |
+
- Сергея Карпенко,
|
19 |
+
- Александра Курчаткина,
|
20 |
+
- Руслана Султанова,
|
21 |
+
- Евгения Щуркина.
|
22 |
+
|
23 |
+
|
24 |
+
Natural Language Processing Project
|
25 |
+
|
26 |
+
The goal of the project is to create a multi-page application on HuggingFace / Streamlit in order to demonstrate some of the capabilities and functionality of a number of machine learning and neural networks technologies in the field of natural language processing.
|
27 |
+
|
28 |
+
The tangible result of the project is an application consisting of the following components:
|
29 |
+
1. A classifier of short reviews of films in English based on three models:
|
30 |
+
(1) A classical logistic regression;
|
31 |
+
(2) A trained LSTM network;
|
32 |
+
(3) A BERT model with retrained last layers of transformers and an added linear fully-connected layer.
|
33 |
+
2. Summarizer of texts in English based on the BERT model.
|
34 |
+
3. A series of GPT models with customizable generation parameters, retrained on the texts of:
|
35 |
+
(1) Jorge Luis Borges;
|
36 |
+
(2) Alexander Pushkin;
|
37 |
+
(3) Oxxxymiron.
|
38 |
+
|
39 |
+
The project has been carried out by members of the DS20 group:
|
40 |
+
- Artyom Doinikov,
|
41 |
+
- Sergey Karpenko,
|
42 |
+
- Alexander Kurchatkin,
|
43 |
+
- Ruslan Sultanov,
|
44 |
+
- Evgeniy Shchurkin.
|