File size: 2,438 Bytes
075fedd
 
 
 
 
 
 
 
0c58317
9a1d15c
075fedd
0c58317
0154eed
9a1d15c
0c58317
 
 
 
2525913
 
1f2febc
2525913
0c58317
 
 
2525913
 
 
 
 
 
0c58317
 
 
 
 
9a1d15c
0397654
 
 
0c58317
 
0397654
 
1f2febc
0397654
 
0c58317
 
2525913
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
---
title: README
emoji: 🐠
colorFrom: yellow
colorTo: gray
sdk: static
pinned: false
---
(English below)
<h1>Vietnamese Vision-Language Model (Vietnamese-VLM)<h1>

<h2>Chúng tôi là ai?</h2>

<p>Vietnamese Vision-Language Model (Vietnamese-VLM) là một dự án nghiên cứu tập trung vào lĩnh vực multimodal, tích hợp cả thị giác và ngôn ngữ cho tiếng Việt.</p>
<p>Nhóm nghiên cứu của Vi-VLM mong muốn đóng góp, phát triển những mô hình và bộ dữ liệu chất lượng cao nhất nhằm thúc đẩy sự phát triển của Trí tuệ nhân tạo trong lĩnh vực Vision-Language.</p>

<h2>Những đóng góp hiện tại</h2>

<ol>
  <li><a href="https://huggingface.co/datasets/Vi-VLM/Vista">Vista: Bộ dữ liệu lớn cho vision-language được xây dựng dựa trên LLAVA, ShareGPT4V, WIT.</a></li>
  <li><a href="https://huggingface.co/Vi-VLM/Vistral-V-7B">Vistral-V (Vistral-Vision): Visual Instruction cho model Vistral - Mô hình hình ảnh và ngôn ngữ lớn cho tiếng Việt.</li>
</ol>

<h2>Các thành viên</h2>

<ul>
  <li><a href="https://www.linkedin.com/in/oanhtran2002/">Oanh Tran</a></li>
  <li><a href="https://github.com/hllj">Hop Bui</a></li>
  <li><a href="https://www.linkedin.com/in/hoanghavn/">Hoang Ha</a></li>
  <li><a href="https://www.linkedin.com/in/pphuc/">Phan Phuc</a></li>
</ul>

-----

<h2>Who are we?</h2>

<p>Vietnamese Vision-Language Model (Vietnamese-VLM) is a research project focusing on the multimodal field, integrating both vision and language for Vietnamese.</p>

<p>Vi-VLM's research team wishes to contribute and develop the highest quality models and data sets to promote the development of Artificial Intelligence in the field of Vision-Language.</p>

<h2>Current contribution</h2>

<ol>
  <li><a href="https://huggingface.co/datasets/Vi-VLM/Vista">Vista: Large dataset for vision-language built on LLAVA, ShareGPT4V, WIT.</a></li>
  <li><a href="https://huggingface.co/Vi-VLM/Vistral-V-7B">Vistral-V (Vistral-Vision): Visual Instruction Tuning for Vistral - Vietnamese Large Vision-Language Model.</li>
</ol>

<h2>Members</h2>

<ul>
  <li><a href="https://www.linkedin.com/in/oanhtran2002/">Oanh Tran</a></li>
  <li><a href="https://github.com/hllj">Hop Bui</a></li>
  <li><a href="https://www.linkedin.com/in/hoanghavn/">Hoang Ha</a></li>
  <li><a href="https://www.linkedin.com/in/pphuc/">Phan Phuc</a></li>
</ul>