Skip to content

PaddleNLP v2.4.2

Compare
Choose a tag to compare
@gongel gongel released this 27 Oct 13:39
· 2583 commits to develop since this release
16aa2ba

New Features

Text summarization应用

  • 增Pegasus中文文本摘要应用,支持Taskflow一键调用,支持FasterGeneration高性能推理,训练推理部署全流程打通。#3275

Question generation

  • 新增问题生成解决方案,提供基于UNIMO-Text和T5的通用问题生成预训练模型,支持Taskflow一键调用,支持FasterGeneration高性能推理,训练推理部署全流程打通。 #3410 #3438 #3560

Machine Translation

  • FasterMBart 支持动转静导出 #3367 #3356
  • MBart tokenizers 升级重构,支持最新 tokenizer 所有功能 #3323
  • 分离 MBartTokenizerMBart50TokenizerMBart50Tokenizer 支持 AutoTokenizerMBartTokenizerMBart50Tokenizer 支持自定义 sentence piece 参数 #3323

Pipelines

Taskflow

  • 优化Taskflow定制模型使用体验,增加模型参数文件的更新检查机制。 #3506

Bug Fix

  • 修复 MBart 限制模型本身翻译语言的问题 #3356
  • 修复 CodeGen 生成时未使用 token type ids 的问题 #3348
  • 修复 CodeGen 自适应生成 attention mask 错误 #3348
  • 修复 T5 在 use_cache=False 情况下解码出错问题 #3115
  • 修复文本摘要taskflow不能加载自定义模型的bug #3533
  • 修复问题生成预测时的bug #3524
  • 修改uie训练代码中utils.py文件中result变量未定义的问题 #3490
  • FAQ Finance修复Paddle Serving 在windows上的bug。#3491
  • 修复Pipelines解析docx文档,文本和图片出现在同一个paragraph的情况。 #3546
  • 修复语义索引的文本分类的数据说明。#3551

Others

  • 新增 T5 对 gated-silu 支持 #3115
  • 升级 T5Tokenizer 以支持 PaddleNLP 最新功能 #3115
  • 新增 T5 对 4D attention mask 支持 #3115
  • 新增 T5 支持以字典形式返回 #3370
  • FasterGeneration 支持 PaddlePaddle 2.4.0-rc0 及以上版本编译 #3545
  • UnifiedTransformer 支持自适应生成 position_idstoken_type_idsattention mask 等功能 #3177
  • UNIMO-Text 支持自适应生成 position_idstoken_type_idsattention mask 等功能 #3349