قیافه استادان رشته های گوناگون از نگاه هوش مصنوعی، ماشین هم از کلیشه ها در امان نیست، عکس
به گزارش وبلاگ هوانورد، زومیت نوشت: آنچه خواهید دید، سوگیری های ذاتی مدل های هوش مصنوعیِ مولدِ تصویر مانند میدجرنی را به وضوح نشان می دهد. باید نگران شویم یا فقط ببینیم و بگذریم؟
انتشار یک ویدیوی 40 ثانیه ای باعنوان چهره استادان بر اساس رشته هایشان در ردیت، بحث جالبی را به راه انداخته است. به عقیده برخی ها و بر اساس تجاربشان این تصاویر به شدت به واقعیت نزدیک هستند. برخی دیگر که نگاه متفاوت تری دارند می گویند بیشتر این تصاویر فقط مردان جاافتاده و سفیدپوست را در لباس اساتید نشان می دهد که در مورد بیشتر مؤسسات دانشگاهی مدرن، صادق نیست.
مولدهای تصویر هوش مصنوعی می توانند در مدل های خود سوگیری داشته باشند، زیرا آن ها از داده هایی که بر رویشان آموزش دیده اند، یاد می گیرند. داده ها نیز اغلب سوگیری های موجود در دنیای واقعی را در دل خود جا داده اند. چنین سوگیری هایی بسته به مدل خاص و داده های مورد استفاده برای آموزش، می توانند به روش های مختلفی ظاهر شوند.
به عنوان مثال، اگر یک مولد تصویر هوش مصنوعی بر روی مجموعه داده ای از تصاویر آموزش دیده باشد که گروه های خاصی از افراد را به طور نامتناسب نشان می دهد، مانند افراد با پوست روشن تر، تصاویر تولیدشده نیز ممکن است این سوگیری را با تولید تصاویر کمتر از افراد با پوست تیره تر نشان دهند. اگر داده های آموزشی حاوی کلیشه ها یا سایر سوگیری ها باشد، مولد تصویر هوش مصنوعی ممکن است یاد بگیرد که آن سوگیری ها را در تصاویر تولیدشده خود بازتولید کند.
افزون براین اگر خود داده های آموزشی هم بی طرف باشند، مدل همچنان ممکن است بر اساس نحوه برچسب گذاری یا حاشیه نویسی داده ها، سوگیری ها را یاد بگیرد. به عنوان مثال، اگر مجموعه داده، اشیا یا افراد خاصی را به گونه ای برچسب گذاری کند که کلیشه ها یا فرضیات را تقویت کند، مولد تصویر هوش مصنوعی ممکن است یاد بگیرد که این سوگیری ها را در خروجی خود تداوم ببخشد.
به نظر محققان از آنجایی که سیستم های تبدیل متن به تصویر با قابلیت یادگیری ماشینی رو به افزایش هستند و به عنوان خدمات تجاری، پذیرش رو به رشدی را تجربه می کنند، اولین گام ضروری برای کاهش خطر نتایج تبعیض آمیز آن ها، تعیین کردن سوگیری های اجتماعی است که از خود نشان می دهند.
محققان و توسعه دهندگان باید داده های آموزشی خود را به دقت تنظیم کنند و از تکنیک هایی مانند داده افزایی، مکانیزم طبقه بندی منصفانه و آموزش خصمانه استفاده کنند تا اطمینان حاصل شود که مدل های حاصل تا حد ممکن عاری از سوگیری هستند.
5858
منبع: خبرآنلاین