⬆️ 升级说明
-
HuggingFaceTGIGenerator和HuggingFaceTGIChatGenerator组件已修改,以兼容huggingface_hub>=0.22.0。如果您使用这些组件,则可能需要升级
huggingface_hub库。为此,请在您的环境中运行以下命令:pip install "huggingface_hub>=0.22.0"
🚀 新功能
- 为
HuggingFaceLocalGenerator添加了streaming_callback参数,允许用户处理流式响应。 - 引入了一个新的
SparseEmbedding类,可用于存储文档的稀疏向量表示。在后续引入稀疏嵌入器和稀疏嵌入检索器时,它将有助于支持稀疏嵌入检索。
⚡️ 增强说明
-
将 Hugging Face 生成器的
max_new_tokens默认值设置为 512。 -
在 Jupyter 笔记本中,Pipeline 的图像将不再自动显示。将显示 Pipeline 的文本表示。
要显示 Pipeline 图像,请使用 Pipeline 对象的
show方法。
🐛 Bug 修复
- base document store 测试中的
test_comparison_in测试用例以前总是通过,无论 document stores 中的in过滤逻辑如何实现。修复后,将实际测试in逻辑。对于未正确实现in过滤器的 document stores,某些测试可能会开始失败。 - 将
HuggingFaceLocalGenerator中的HFTokenStreamingHandler放在惰性导入块中。这修复了一些破坏核心集成的错误。 - 修复了
Pipeline.run()逻辑,使所有输入都有默认值的组件按正确的顺序运行。这是因为我们在内部收集要运行的组件列表时,是按照它们在创建 Pipeline 时添加的顺序运行的。这导致一些组件在收到所有输入之前就运行了。 - 修复了
HuggingFaceTEITextEmbedder在与使用 Docker 部署的 Text-Embedding-Inference 端点一起使用时返回形状不正确的嵌入的问题。 - 为
HuggingFaceTGIChatGenerator添加了@component装饰器。缺少此装饰器导致无法在 pipeline 中使用HuggingFaceTGIChatGenerator。
