一种提高人工智能公平性和准确性的技术

发布：2022-09-26 15:08:27

阅读：3679

作者：麻省理工学院

对于使用机器学习模型帮助他们做出决策的工作人员来说，知道何时信任模型的预测并不总是一件容易的事，尤其是这些模型通常非常复杂，以至于它们的内部运作规律仍然是个谜。

有时会使用一种称为选择性回归的技术，在该技术中，算法模型会估计每个预测的置信水平，并在其置信度过低时拒绝预测。然后人类可以检查这些案例，收集更多信息，并手动对每个案例做出决定。

虽然选择性回归已被证明可以提高算法模型的整体性能，但麻省理工学院和MIT-IBM沃森人工智能实验室的研究人员发现，该技术可能对数据代表性不足的人群产生相反的效果。随着算法的可信度随着选择性回归的增加而增加，其做出正确预测的机会也会增加，但这种情况并不绝对。

例如，贷款审批的算法模型错误率很低，但它实际上可能会对某一类申请人群做出错误的评估。发生这种情况的原因是模型的置信度度量是使用代表人数过多的数据组进行训练的，因此对于代表人数不足的数据组可能不准确。

麻省理工学院的研究人员就开发了两种可以解决这个问题的算法。算法结果表明，这两种算法减少了影响边缘化子组的性能差异。

回归是一种估计因变量和自变量之间关系的技术。在机器学习中，回归分析通常用于预测任务，例如根据房屋的特征（卧室数量、平方英尺等）预测房屋的价格。通过选择性回归，算法模型可以做出两种选择，执行每一个数据，它可以做出预测或放弃预测。

当算法放弃预测时，会减少它进行预测的样本比例，这被称为覆盖率。以此提高算法模型的整体性能。但这也会放大数据集中存在的偏差，当模型没有来自某些子组的足够数据时，就会出现偏差。对于代表性不足的个人，这可能会导致错误或错误的预测。

麻省理工学院的研究人员旨在得出模型的整体错误率会随着选择性回归的提高而提高的结论，他们把这种情况称之为单调选择性风险。

该团队开发了两种神经网络算法，采用这种公平标准来解决问题。

第一种算法保证模型用于进行预测的特征包含有关数据集中敏感属性的所有信息，例如种族和性别，这些信息与感兴趣的目标变量相关。敏感属性是可能不用于决策的特征，通常是由于法律或组织政策。

第二种算法采用校准技术来确保模型对输入做出相同的预测，无论是否将任何敏感属性添加到该输入。

研究人员通过将这些算法应用于可用于高风险决策的真实数据集来测试这些算法。一是保险数据集，用于使用人口统计数据预测向患者收取的年度医疗费用总额；另一个是犯罪数据集，用于使用社会经济信息预测社区中的暴力犯罪数量。两个数据集都包含个人的敏感属性。

当他们在用于选择性回归的标准机器学习方法之上实施他们的算法时，他们能够通过降低每个数据集中少数子组的错误率来减少差异。此外，这是在没有显着影响整体错误率的情况下完成的。

他们希望改进选择性回归中的置信度估计，以防止模型出现置信度低但预测正确的情况。研究人员还表示，这可以减少工作量并进一步简化决策过程。

人工智能

人工智能之机器翻译：技术革新与未来趋势

人工智能中的机器翻译（Machine Translation, MT）是自然语言处理（NLP）领域的重要分支，其核心在于通过算法与模型将一种语言自动转换为另一种语言。随着全球化进程加速，跨语言交流需求激增，机器翻译凭借高效性与低成本优势，成为打破语言障碍的关键工具。例如，在跨境电商、国际会议、学术研究等场景中，机器翻译不仅提升了沟通效率，还推动了信息的快速流通与共享。

2025-07-14 17:35:46

人工智能之机器翻译：语言屏障破解的技术革命

机器翻译历经规则驱动、统计模型至神经网络三次技术迭代，逐步突破语言转换的精度与效率瓶颈。早期系统依赖人工编写语法规则与词典，覆盖语种有限且维护成本高。当前主流技术基于深度神经网络，通过海量平行语料训练模型，实现端到端的语义映射与上下文理解，显著提升复杂句式与专业术语的翻译质量。

2025-07-14 17:35:06

新华视点丨人工智能时代，我们需要怎样的文科人才？

正值2025年高考志愿填报期，有关专业选择的讨论再度升温。在人工智能迅猛发展的背景下，“文理抉择”这一老话题又引发新讨论。从当年“学好数理化，走遍天下都不怕”的口号，到近两年“文科无用”等论调，种种说法令不少考生及家长心生迷茫。文科，还可以选择吗？高校对文科有哪些新探索值得关注？未来，我们需要怎样的文科人才？

2025-07-14 10:27:58

人工智能伦理与治理：构建负责任的技术发展路径

人工智能伦理与治理是当前科技领域亟需解决的关键议题。随着AI技术的广泛应用，其潜在风险逐渐显现，包括数据隐私泄露、算法偏见、社会公平性缺失等问题。例如，人脸识别技术可能因数据偏差导致误判，深度伪造技术可能被滥用以制造虚假信息。这些问题不仅影响技术本身的可信度，更对社会秩序和人类价值观构成挑战。因此，建立系统的伦理框架和治理机制，成为推动人工智能可持续发展的核心任务。

2025-07-11 17:39:01

人工智能伦理与治理：构建可信AI的体系化路径

人工智能伦理关注算法决策的公平性、透明度及社会影响。随着AI渗透至医疗、金融、司法等领域，伦理问题凸显为三大矛盾：数据隐私与算法效率：训练数据可能隐含用户隐私，如何在保障数据安全的前提下提升模型性能成为关键。算法偏见与社会公平：历史数据中的偏差可能导致AI系统歧视特定群体，例如信贷评分模型对少数族裔的不公判定。责任归属困境：自动驾驶事故、AI生成内容侵权等场景中，开发者、运营商与用户的权责边界模糊。

2025-07-11 17:38:06

人工智能驱动智能制造：重塑制造业的未来格局

人工智能（AI）作为第四次工业革命的核心驱动力，正在深刻重构制造业的底层逻辑。通过将深度学习、计算机视觉、自然语言处理等技术与制造流程深度融合，AI不仅提升了生产效率，更推动了从“自动化”向“智能化”的范式转变。智能制造的核心在于数据驱动决策，而AI通过实时感知、动态分析和自主优化，使制造系统具备了类人化的认知能力，从而实现从“人控”到“机控”的系统性升级。

2025-07-10 18:03:56

人工智能之智能制造：重塑现代工业新生态

人工智能之智能制造指通过机器学习、物联网（IoT）、大数据分析等技术，实现生产流程的自主优化与精准决策。其核心在于构建“感知-分析-执行”闭环，将设备、物料、人员数据转化为实时洞察，驱动制造系统从自动化向智能化跃迁。

2025-07-10 18:03:15

人工智能之智慧医疗：重塑医疗行业的未来图景

随着人工智能技术的快速发展，智慧医疗正成为推动医疗行业变革的重要力量。通过深度学习、计算机视觉、自然语言处理等技术的融合，人工智能正在优化诊疗流程、提升医疗效率、改善患者体验，并为构建高效、精准、普惠的医疗体系提供创新解决方案。

2025-07-09 17:43:12

人工智能之智慧医疗：技术革新与医疗未来

人工智能之智慧医疗指通过机器学习、自然语言处理、影像识别等技术，优化疾病诊疗、药物研发及健康管理流程的智能化体系。其核心在于将医疗数据（如电子病历、影像资料、基因序列）转化为可分析的数字化资源，为临床决策提供科学支持。

2025-07-09 17:42:26

人工智能之智慧交通：重塑未来出行的新引擎

随着城市化进程的加速和科技的飞速发展，人工智能技术正成为推动智慧交通建设的核心力量。通过深度学习、计算机视觉、物联网等先进技术的融合，人工智能正在重新定义交通管理、出行体验和运输效率，为构建高效、安全、绿色的交通系统提供创新解决方案。

2025-07-08 18:00:53