发布时间:2022-11-03 来源:中国档案报 字体:【大】【中】 【小】
依据瑞士法律规定,包含敏感个人信息的元数据只能在其封闭期结束后对外公布,但同时,每位公民又具有从公共来源获得和传播信息的基本权利。为在法律规定和公众需求之间取得平衡,最大限度地释放档案数据的潜在价值,联邦档案馆决定在法律允许的范围内尽可能地公布更多数据,由此产生了匿名化服务。匿名化服务基于由苏黎世大学文本处理中心的专家代为开发的计算语言学程序,一系列机器学习系统从手动注释的数据、记录和上下文中学习单词是否需要进行匿名化处理。多种算法的集成使该服务具有更高的识别准确率,目前自然人的姓名能较好地被识别和匿名化,受保护较少的法律实体则相对逊色。对于其中可能存在的匿名化错误,用户可向瑞士联邦档案馆报告,由档案馆手动进行纠正。
借助智能的匿名化服务,元数据中包含的敏感个人数据如自然人和法人代表的姓名、出生日期以及能够识别他们的号码(如社会保险号码)被匿名化,原先处于封闭期的档案元数据被开放给公众以供进一步的研究利用,既遵循法律要求保护了个人数据,又保障了公民获取、传播信息的基本权利。
原载于《中国档案报》2022年11月3日 总第3902期 第三版
附件下载