کتاب «چالشهای اخلاقی علم داده» اثری جامع و آموزشی است که با هدف پر کردن خلأ موجود در منابع درسی و کاربردی حوزه Ethics of Data Science نوشته شده است. نویسنده که تجربه سالها تدریس درس «داده، علم و اخلاق» در دانشگاه آنتورپ را دارد، میکوشد مفاهیم بنیادین، تکنیکهای کلیدی و نمونههای واقعی را در قالبی منسجم و قابلفهم ارائه کند. کتاب به مخاطبانی همچون دانشجویان علوم داده، علوم کامپیوتر و مدیریت، مدیران حوزه کسبوکار، و متخصصان تحلیل داده کمک میکند تا بتوانند پرسشهای درست را در پروژههای دادهمحور طرح کنند، تصمیمات اخلاقی آگاهانه بگیرند و خطرات پنهان فناوری—از جمله نقض حریم خصوصی، سوگیری الگوریتمی، تصمیمگیری غیرشفاف و پیامدهای اجتماعی داده—را بهتر تشخیص دهند.
این اثر با تاکید بر اهمیت روزافزون اخلاق در علم داده نشان میدهد چگونه تصمیماتی که ظاهراً فنی به نظر میرسند، میتوانند اثرات گستردهای بر زندگی افراد و گروههای اجتماعی داشته باشند. کتاب علاوه بر تشریح مبانی نظری اخلاق، با تکیه بر مثالهای واقعی—از انتشار دادههای نتفلیکس و IMDb تا تحلیل خطر حملات بازشناسایی—ابعاد عملی چالشها را برجسته میسازد. همچنین با اشاره به راهکارهایی مانند ناشناسسازی، افزودن نویز و سنجش عدالت گروهی، مسیرهایی برای طراحی سیستمهای مسئولانهتر ارائه میکند. این معرفی ادبی و کاربردی، کتاب را به منبعی ضروری برای هر فرد درگیر با داده تبدیل کرده است.
فهرست مطالب
مقدمه مترجم 13
پیشگفتار نویسنده 17
فصل 1: مقدمهای بر اخلاق علم داده 19
1-1- ظهور علم داده (اخلاق) 21
1-2- چرا باید اهمیت بدهیم؟ 22
1-3- درست و غلط 26
1-4- علوم داده 31
1-5- تعادل اخلاقی در علم داده 34
1-6- چارچوب FAT Flow برای اخلاق در علم داده 39
1-6-1- نقشهای متفاوت در علم داده 40
1-6-2- عادلانه، پاسخگو و شفاف 43
1-6-3- چارچوب FAT Flow برای اخلاق علم داده 51
1-7- اخلاق جمعآوری دادهها 51
1-7-1- عدالت 51
1-7-2- شفافیت 53
1-8- اخلاق پیشپردازش داده 55
1-8-1- عدالت 55
1-8-2- شفافیت 58
1-9- مدلسازی اخلاقی 59
1-9-1- عدالت 59
1-9-2- شفافیت 60
1-10- ارزیابی اخلاقی مدل 61
1-10-1- عدالت 61
1-10-2- شفافیت 61
1-11- استقرار اخلاقی مدل 62
1-11-1- شفافیت 63
1-12- خلاصه 63
فصل 2: جمعآوری اخلاقی داده 65
2-1- حریم خصوصی بهعنوان یک حق انسانی 68
2-1-1- اهمیت حریم خصوصی 68
2-1-2- در هر صورت هیچ حریم خصوصی نداری! با این موضوع کنار بیا 72
2-2- مقررات 74
2-2-1- GDPR 74
2-2-1-1- مفاهیم حفاظت از دادهها 75
2-2-1-2- مبنای قانونی 79
2-2-1-3- اصول مربوط به پردازش دادههای شخصی 82
2-2-2- بحث اول 86
2-2-2-1- عمومی بودن اطلاعات به معنای آزاد بودن کپیبرداری از آنها نیست! 87
2-3- مکانیزمهای حریم خصوصی 89
2-3-1- رمزنگاری 89
2-3-2- رمزنگاری متقارن 91
2-3-3- رمزنگاری نامتقارن 93
2-3-4- رمزنگاری برای حفاظت از دادهها 97
2-3-4-1- درهمسازی 98
2-3-4-2- محاسبات کوانتومی 105
2-3-4-3- مبهمسازی داده 108
2-3-4-4- حریم خصوصی تفاضلی غیرمتمرکز 111
2-3-5- بحث دوم 113
2-4- داستانهای هشداردهنده: درهای پشتی و رمزنگاری پیام 114
2-4-1- درهای پشتی دولت 114
2-4-2- استدلالهای موافقان در پشتی دولت 116
2-4-3- استدلالهای مخالفان در پشتی دولت 118
2-4-3-1- حریم خصوصی در برابر امنیت 119
2-4-3-2- امنیت در برابر امنیت 119
2-4-3-3- بیفایده بودن دربهای پشتی دولتی در اپلیکیشنهای پیامرسان محبوب و گوشیهای هوشمند 121
2-4-4- و در نهایت؟ 122
2-4-5- بحث سوم 123
2-4-5-1- نوع داده: دیجیتال در مقابل غیردیجیتال؟ 123
2-4-6- بحث چهارم 125
2-5- سوگیری 125
2-5-1- سوگیری: یک مفهوم چندوجهی 125
2-5-2- سوگیری در نمونهگیری از دادهها 127
2-6- داستانهای هشداردهنده: ناهمواریها، گوریلها و رزومهها 134
2-7- آزمایشهای انسانی 138
2-7-1- منشأ خطمشیهای مربوط به آزمایشهای انسانی 138
2-7-2- آزمایشهای CD و AB 141
2-8- داستانهای هشداردهنده: قرار ملاقات، خوشبختی و تبلیغات 143
2-8-1- آزمایش مدل پیشبینی تطابق زوجها در سایت OKCupid 143
2-8-2- مطالعه یک همهگیری در فیسبوک 145
2-9- خلاصه 146
فصل 3: پیشپردازش اخلاقی دادهها 149
3-1- تعریف و اندازهگیری حریم خصوصی 152
3-1-1- حذف ، گروهبندی و ایجاد اغتشاش 153
3-1-2- k-ناشناختگی 156
3-1-3- حملات همگنسازی و پیوند 158
3-1-4- l- تنوع و t- نزدیکی 160
3-2- داستانهای هشداردهنده: بازشناسایی 161
3-2-1- بازشناسایی بر اساس نمرات فیلمها 163
3-2-2- بازشناسایی بر اساس جستوجوهای اینترنتی 168
3-2-3- بازشناسایی بر اساس موقعیت جغرافیایی 172
3-2-4- بحث پنجم 176
3-3- تعیین و گزینش متغیرها 177
3-3-1- گزینش متغیرهای ورودی 177
3-3-2- تعیین متغیر هدف 178
3-4- داستان هشداردهنده: بارداری و تشخیص چهره 180
3-4-1- تبلیغات هدفمند برای زنان باردار 180
3-4-2- بحث ششم 183
3-4-3- تشخیص چهره 184
3-4-4- بحث هفتم 190
3-5- برچسبگذاری عادلانه 191
3-5-1- اندازهگیری عدالت یک مجموعهداده 191
3-5-2- پاکسازی 193
3-6- داستان هشداردهنده: سوگیری زبانی 196
3-7- خلاصه 199
فصل 4: مدلسازی اخلاقی 203
4-1- دادهکاوی با حفظ حریم خصوصی 206
4-1-1- حریم خصوصی ε- تفاضلی 206
4-1-1-1- تعریف حریم خصوصی تفاضلی 206
4-1-1-2- مزایا و کاربردهای حفاظت از حریم خصوصی دادهها به روش تفاضلی 212
4-1-2- اثبات با دانش صفر 215
4-1-3- رمزنگاری همریخت 219
4-1-4- امنیت در محاسبات چندجانبه 224
4-1-5- یادگیری فدرال (مشارکتی) 228
4-1-6- خلاصه روشهای حفظ حریم خصوصی در مرحله مدلسازی 231
4-2- مدلسازی با آگاهی نسبت به تبعیض 232
4-2-1- اندازهگیری عدالت مدلهای پیشبینی 233
4-2-2- حذف سوگیری 240
4-3- داستان هشداردهنده: پیشبینی تکرار جرم و تبعیض بر اساس منطقه مسکونی 243
4-3-1- پیشبینی تکرار جرم 243
4-3-2- اعمال خطوط قرمز 245
4-3-3- خلاصه مدلسازی آگاه از تبعیض 249
4-4- مدلهای قابل فهم و هوش مصنوعی توضیحپذیر 250
4-4-1- درک کردن در برابر توضیح دادن 253
4-4-2- اندازهگیری قابل فهم بودن 257
4-4-3- چرا نیاز به درک و توضیح پیشبینی مدلها نیاز داریم؟ 261
4-4-4- توضیح مدلهای پیشبینی وپیشبینی که انجام میدهند 267
4-4-5- توضیحات کلی (سراسری) 269
4-4-5-1- تحلیل حساسیت 269
4-4-5-2- مبتنی بر نمودار 272
4-4-5-3- استخراج قواعد 274
4-4-6- توضیحات نمونههای خاص 275
4-4-6-1- نمودارهای مقدار ویژگی 275
4-4-6-2- رتبهبندی اهمیت ویژگی 276
4-4-6-3- حقیقت جایگزین برای نمونهها 278
4-4-7- بحث هشتم 279
4-5- داستان هشداردهنده: توضیح طبقهبندی صفحات وب 280
4-5-1- خلاصه مدلهای قابل فهم و هوش مصنوعی توضیحپذیر 282
4-6- اعمال ترجیحات اخلاقی: خودروهای خودران 284
4-7- خلاصه 287
فصل 5: ارزیابی اخلاقی 291
5-1- اندازهگیری اخلاقی 294
5-1-1- ارزیابی صحیح: اقدامات علم داده به شیوهای صحیح 294
5-1-2- ارزیابی شاخصهای FAT 297
5-1-2-1- بحث نهم 299
5-1-3- ارزیابی سایر نیازمندیهای اخلاقی 300
5-1-3-1- پایداری/ استوار بودن 300
5-1-3-2- پایدار/ تجدیدپذیر 301
5-2- تفسیر اخلاقی نتایج 302
5-2-1- هک مقدار p 303
5-2-2- مقایسه چندباره 307
5-3- گزارشدهی اخلاقی 309
5-3-1- گزارشدهی شفاف 309
5-3-2- گزارشدهی دانشگاهی اخلاقی 312
5-3-2-1- قابلیت بازتولید: نشانهای بر دیوار 312
5-3-2-2- رقابت دانشگاهیان 314
5-3-2-3- آییننامه رفتار حرفهای برای یکپارچگی پژوهشی 315
5-3-2-4- بحث دهم 317
5-3-2-5- داستان هشداردهنده از یک استاد دانشگاه 318
5-4- خلاصه 320
فصل 6: بهکارگیری اخلاقی 323
6-1- دسترسی به سیستم 326
6-1-1- دسترسی محدود 327
6-1-2- نسخههای مختلف برای افراد مختلف 330
6-2- راه حلهای مختلف برای پیشبینیهای مختلف 332
6-2-1- تفکیک قیمت مبتنی بر داده 332
6-2-2- تغییر رفتار به منظور واقعی کردن پیشبینیها 335
6-3- داستانهای هشداردهنده: سانسور جستجو و شناسایی چهره 337
6-3-1- جست و جوی گوگل در چین 337
6-3-2- دسترسی به نرم افزار تشخیص چهره 339
6-4- صداقت و دیپفیک 340
6-5- حکمرانی 344
6-5-1- تشکیل یک کمیته نظارت اخلاقی 344
6-5-2- تدوین خطمشی 347
6-5-3- اجرای خط مشی 348
6-6- پیامدهای ناخواسته 349
6-6-1- مدل علم دادهای که برخلاف انتظار عمل میکند 349
6-6-2- تأثیر غیرمنتظره بر انسانها: از دست دادن شغل (؟) 351
6-7- خلاصه 359
فصل 7: نتیجهگیری 361
منابع 369
| دسته بندی موضوعی | موضوع فرعی |
| علوم انسانی |
کلیات
|