能做文本的embedding吗?

#7
by dingguofeng - opened

请问我该如何送一个文本进去,让模型输出他的embedding?

not supported

not supported

QAQ~

没记错的话, 应该是可以反推LLM的embeeding模型

没记错的话, 应该是可以反推LLM的embeeding模型

你好,我是觉得如果能拿到embedding可以做其他很多事情,请问一下该如何反推呢?

This comment has been hidden

请问解决了吗

请问解决了吗

没有解决,好像就是不行

请问解决了吗

没有解决,好像就是不行

你说的把文字输进去,然后取llm里面的hidden states吗?

应该是指 token向量化。 我之前弄错了,反推embedding的难度有点大,很难实现。

我看qwen有提供embedding的api,不知道能不能满足你的需求:
import os
from openai import OpenAI

client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"), # 如果您没有配置环境变量,请在此处用您的API Key进行替换
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1" # 百炼服务的base_url
)

completion = client.embeddings.create(
model="text-embedding-v3",
input='The clothes are of good quality and look good, definitely worth the wait. I love them.',
dimensions=1024,
encoding_format="float"
)

print(completion.model_dump_json())

应该是指 token向量化。 我之前弄错了,反推embedding的难度有点大,很难实现。

我看qwen有提供embedding的api,不知道能不能满足你的需求:
import os
from openai import OpenAI

client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"), # 如果您没有配置环境变量,请在此处用您的API Key进行替换
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1" # 百炼服务的base_url
)

completion = client.embeddings.create(
model="text-embedding-v3",
input='The clothes are of good quality and look good, definitely worth the wait. I love them.',
dimensions=1024,
encoding_format="float"
)

print(completion.model_dump_json())

Qwen第一层不就是 embed_tokens层,这个就是把输入的token转成emb。这层的输出是不是你想要的那个

Your need to confirm your account before you can post a new comment.

Sign up or log in to comment