OpenAI发布开源模型OpenAIPrivacyFilter,可检测并脱敏文本中个人隐私信息

币界网消息,OpenAI 今日发布开源模型 OpenAI Privacy Filter,旨在检测和红线处理文本中的个人身份信息(PII)。该模型拥有 15 亿个总参数和 5000 万个活跃参数,支持高达 12.8 万枚代币的上下文窗口。OpenAI Privacy Filter 采用双向令牌分类模型架构,能够识别私人姓名、地址、电子邮件、电话、URL、日期、账号及密钥等八类信息,并在 PII-Masking-300k 基准测试中取得 96%的 F1 分数。目前该模型已根据 Apache 2.0 协议在 Hugging Face 和 GitHub 开放,支持开发者进行本地部署和微调。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注