我想用AzureOpenAI和Langchain做一个文档问答程序

sczxawaw 于 2023-11-21 发布在其他

关注(0)|答案(2)|浏览(252)

llm = AzureOpenAI(openai_api_key=OPENAI_API_KEY, deployment_name=OPENAI_DEPLOYMENT_NAME, model_name=MODEL_NAME)
# Configure the location of the PDF file.
pdfReader = PdfReader('data\borders.pdf')
# Extract the text from the PDF file.
raw_text = ''
for i, page in enumerate(pdfReader.pages):
    text = page.extract_text()
    if text:
        raw_text += text
# Show first 1000 characters of the text.
raw_text[:1000]
# Split the text into chunks of 1000 characters with 200 characters overlap.
text_splitter = CharacterTextSplitter(        
    separator = "\n",
    chunk_size = 1000,
    chunk_overlap  = 200,
    length_function = len,
)
pdfTexts = text_splitter.split_text(raw_text)
# Show how many chunks of text are generated.
len(pdfTexts)
# Pass the text chunks to the Embedding Model from Azure OpenAI API to generate embeddings.
embeddings = OpenAIEmbeddings(openai_api_key=OPENAI_API_KEY, deployment=OPENAI_EMBEDDING_MODEL_NAME, client="azure", chunk_size=1)
# Use FAISS to index the embeddings. This will allow us to perform a similarity search on the texts using the embeddings.
# https://python.langchain.com/en/latest/modules/indexes/vectorstores/examples/faiss.html
pdfDocSearch = FAISS.from_texts(pdfTexts, embeddings)
# Create a Question Answering chain using the embeddings and the similarity search.
# https://docs.langchain.com/docs/components/chains/index_related_chains
chain = load_qa_chain(llm, chain_type="stuff")
# Perform first sample of question answering.
inquiry = "Who is the author of this book?"
docs = pdfDocSearch.similarity_search(inquiry)
chain.run(input_documents=docs, question=inquiry)

字符串
它给出了这个错误：openai.error.InvalidRequestError:完成操作不适用于指定的模型gpt-4。请选择其他模型并重试。您可以在此处了解有关每个操作可以使用哪些模型的详细信息：https://go.microsoft.com/fwlink/?linkid=2197993。

Azure

来源：https://stackoverflow.com/questions/77379135/i-am-trying-to-make-a-docs-question-answering-program-with-azureopenai-and-langc

2条答案

按热度按时间

aiqt4smr1#

它给出了这个错误：openai.error.InvalidRequestError:完成操作不适用于指定的模型gpt-4。请选择其他模型并重试。您可以在此处了解有关每个操作可以使用哪些模型的详细信息。
当您在配置中传递错误的模型或不正确的部署时，会发生上述错误。
根据这个**Document-1和Document-2**，需要**text-davinci-003模型来完成，需要text-embedding-ada-002**模型来嵌入。
当我尝试使用上面的模型时，代码执行并给我输出。

产品代码：

from langchain.llms import AzureOpenAI
from PyPDF2 import PdfReader
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores.faiss import FAISS
from langchain.chains.question_answering import load_qa_chain
OPENAI_API_KEY="xxxxx"
OPENAI_DEPLOYMENT_NAME="testxxxa"    #deployment name with text-embedding-ada-002 model
deployment="textxxx"     #deployment name with text-davinci-003 model
openai_api_base1="xxxxxx"
llm = AzureOpenAI(openai_api_key=OPENAI_API_KEY, deployment_name=deployment,openai_api_base=openai_api_base1,openai_api_version="2022-12-01",openai_api_type="azure")
pdfReader = PdfReader('example.pdf')
raw_text = ''
for i, page in enumerate(pdfReader.pages):
    text = page.extract_text()
    if text:
        raw_text += text
raw_text[:1000]
text_splitter = CharacterTextSplitter(        
    separator = "\n",
    chunk_size = 1000,
    chunk_overlap  = 200,
    length_function = len,
)
pdfTexts = text_splitter.split_text(raw_text)
len(pdfTexts)
embeddings = OpenAIEmbeddings(openai_api_key=OPENAI_API_KEY, deployment=OPENAI_DEPLOYMENT_NAME, openai_api_base=openai_api_base1, openai_api_type="azure", openai_api_version="2022-12-01",chunk_size=1)
pdfDocSearch = FAISS.from_texts(pdfTexts, embeddings)
chain = load_qa_chain(llm, chain_type="stuff")
inquiry = "Which month is specified?"
docs = pdfDocSearch.similarity_search(inquiry)
print(chain.run(input_documents=docs, question=inquiry))

字符串

输出：

September

型
x1c 0d1x的数据

展开查看全部

赞(0）回复(0）举报 2023-11-21

ergxz8rk2#

在OpenAI中，你必须对文本生成进行主要操作：

第一个月
chatCompletion个

一些模型可用于完成（例如：GPT3.5版本0301，GPT-4等），其他可用于聊天完成（例如：GPT3.5版本0613，GPT-4等）。
在你的代码中有一些东西是不可见的，那就是langchain将在其步骤load_qa_chain中使用OpenAI和completion操作。
文档：https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/models#model-summary-table-and-region-availability

的
因此，在您的情况下，您应该在设置llm时传递一个符合completion查询的部署：

llm = AzureOpenAI(openai_api_key=OPENAI_API_KEY, deployment_name=OPENAI_DEPLOYMENT_NAME, model_name=MODEL_NAME)

字符串

展开查看全部

赞(0）回复(0）举报 2023-11-21

我来回答

我想用AzureOpenAI和Langchain做一个文档问答程序

2条答案

相关问题

热门标签

最新问答