автор: Автор: БЕН БРУБЕЙКЕР

В наши дни алгоритмы используются повсеместно. Они определяют рекламу, которую мы видим в Интернете, проверяют заявки на работу, устанавливают цены на товары и услуги, а также выполняют множество других задач. Это делает еще более важным понимание того, как они могут работать неправильно — например, в результате утечки конфиденциальных персональных данных или дискриминации соискателей работы. Может ли математика помочь понять, как предотвратить неправильное поведение алгоритмов?
Это задача, стоящая перед исследователями, которые используют инструменты теоретической информатики для изучения алгоритмической конфиденциальности и справедливости, и это непростая задача. Как я уже говорил в выпуске «Основ» от 9 сентября 2024 года, специалисты—теоретики в области информатики традиционно изучают объективные свойства алгоритмов, такие как скорость и использование памяти, которые легко поддаются количественной оценке, по крайней мере в принципе. Но неочевидно, как перевести более субъективные представления о конфиденциальности и справедливости в точные математические термины.
Возьмем, к примеру, конфиденциальность. Когда организации анализируют наборы данных, содержащие конфиденциальную личную информацию, они часто предпринимают шаги по анонимизации записей. Но на удивление легко помешать таким мерам, сопоставив предположительно анонимные данные с общедоступной информацией. “Человеческая интуиция в отношении того, что является личным, не особенно хороша”, — как выразился в 2012 году специалист по информатике Фрэнк Макшерри.
Справедливость — понятие еще более неопределенное, отчасти потому, что она по своей сути многогранна. Существует множество способов разделить любую популяцию на группы, и не всегда возможно найти один алгоритм, который выглядел бы справедливым со всех точек зрения. Несмотря на эти трудности, математическое мышление о конфиденциальности и справедливости имеет свои преимущества. Это дает возможность точно определить, как решения при разработке алгоритмов влияют на реальный мир.
В конечном счете, исследования в области компьютерных наук не могут подсказать нам, как найти компромисс между открытостью и конфиденциальностью или какое определение справедливости нам следует предпочесть. Но они могут помочь нам лучше понять последствия нашего выбора. В мире, изобилующем алгоритмами, это важно как никогда.
Что нового и примечательного
В знаковой статье 2005 года специалист по информатике Синтия Дворк (Cynthia Dwork) и двое ее коллег представили понятие под названием “дифференциальная конфиденциальность”, которое позволило исследователям точно количественно оценить соотношение между анонимностью и точностью алгоритмов анализа данных. Эрика Кларрайх рассказала о том, как это работает, в одной из первых статей, опубликованных в Quanta. С тех пор Дворк обратила свое внимание на справедливость алгоритмов классификации, таких как алгоритмы, которые решают, принимать или отклонять заявки на получение кредита. В 2016 году в интервью Quanta она ответила на вопросы Кевин Хартнетт (Kevin Hartnett) Дворк (Dwork) рассказал о том, почему из-за множества конкурирующих соображений справедливость изучать сложнее, чем конфиденциальность, и что побуждает ее решать столь сложную проблему.
Справедливость также является главной заботой, когда вы хотите разделить ресурсы между сторонами с конкурирующими претензиями. Специалисты по информатике часто изучают эту проблему, используя игровой сценарий: как правильно разделить торт? Задача проста, если в ней участвуют всего два человека. Если один человек режет, а другой выбирает, какой кусочек ему взять, ни один из участников не сможет смошенничать. Но только в 2016 году исследователи разработали алгоритм, который работает для любого количества участников. Кларрайх также рассказал об этом прорыве, а затем выступил с объяснением противоречий между различными понятиями справедливости в задаче о разрезании торта. Даже в кажущихся простыми ситуациях справедливость может привести к путанице. Иногда исследования в области справедливости и конфиденциальности могут выявить связи с традиционными темами теоретической информатики. Недавно Дворк и другие исследователи обнаружили, что алгоритмическая справедливость связана с тем, что затрудняет решение определенных вычислительных задач. Лакшми Чандрасекаран сообщила об этом удивительном результате в прошлом году. Это хорошая иллюстрация того, что научный прогресс не всегда идет от теории к практическому применению — иногда он идет другим путем.
Исследуй дальше:

- В сотрудничестве с Бюро переписи населения США YouTube-канал minutephysics выпустил увлекательное видео-разъяснение по вопросам дифференцированной конфиденциальности.
- Трое ученых-компьютерщиков написали статью, в которой утверждали, что традиционного подхода к дифференцированной конфиденциальности недостаточно для защиты конфиденциальной информации в эпоху моделей искусственного интеллекта, обученных на общедоступных данных со всего Интернета.
- В провокационном посте исследователь машинного обучения Бен Рехт утверждал, что математический подход к алгоритмической справедливости является ошибочным.
Фонд Саймонса.