انتقاد پژوهشگر سابق OpenAI از داده برداری و نقض احتمالی قانون حق نشر
به گزارش ایران کروز، سوچیر بالاجی، یکی از پژوهشگران سابق OpenAI که تا ماه آگوست 2024 در این شرکت مشغول به کار بوده است، اخیراً در انتقادی جدی علیه این شرکت اظهار داشت که OpenAI در فرآیند جمع آوری و استفاده از داده ها برای آموزش مدل های هوش مصنوعی خود، قوانین حق امتیاز را نقض می نماید.

بالاجی در ابتدا تصور می کرد که بخشی از یک پروژه تحقیقاتی فرق دارد و فکر نمی کرد که محصول نهایی به صورت چت بات و ابزارهای فراوری تصویر عرضه گردد. به گفته او، وقتی شما برای یک پروژه تحقیقاتی کار می کنید، استفاده از هر داده ای معمول است، اما این دیدگاه زمانی تغییر کرد که بالاجی به شکل نهایی محصول و استفاده از آن در مقیاس تجاری پی برد.
بالاجی، که فارغ التحصیل دانشگاه برکلی است، معتقد است که روش های فعلی داده برداری OpenAI، به ویژه برای محصولات عظیمی چون GPT-4 و DALL-E، بیشتر از آن که سودمند باشد، به اینترنت و جامعه آسیب می زند. او تأکید می نماید که استفاده از این داده ها نه تنها ممکن است به منابع اطلاعاتی و خدمات اینترنتی آسیب برساند، بلکه تهدیدی برای حقوق نویسندگان، ناشران، و کاربران فردی محسوب می گردد. به گفته او، اگر کسی با روش های OpenAI هم عقیده نباشد، باید شرکت را ترک کند؛ و او به همین خاطر نیز از این مجموعه جدا شده است.
OpenAI برای توسعه مدل های خود، از داده های عمومی موجود در وب استفاده می نماید. شرکت اعلام نموده است که این کار را تحت اصول استفاده منصفانه (Fair Use) و مطابق با اصول حقوقی پذیرفته شده انجام می دهد. در بیانیه ای، OpenAI بیان نموده که استفاده از داده های عمومی برای آموزش مدل های هوش مصنوعی هم برای نوآوری و هم برای رقابت جهانی اهمیت دارد. با این حال، هنوز قانونی درباره استفاده منصفانه در زمینه آموزش هوش مصنوعی به تصویب نرسیده و OpenAI با شکایات متعددی روبه رو است، از جمله از سوی روزنامه هایی مانند نیویورک تایمز.
تبلیغ متنی
ویزای مولتی آلمان
-
دلیل و عوارض مشکل پزشکی از چیست؟
بالاجی بر این باور است که OpenAI در واقع داده های دارای حق نشر را بدون اجازه جمع آوری و ترکیب می نماید. او می گوید که خروجی های مدل های هوش مصنوعی این شرکت دقیقاً کپی شده از داده های اولیه نیستند، اما در عین حال اصالت و نوآوری کاملی هم ندارند و ترکیب و استفاده مجدد از داده های موجود را به عنوان نمونه ای از نقض قانون حق نشر معرفی می نماید. او برای حمایت از دیدگاه خود، تحلیل های ریاضی ای منتشر نموده و معتقد است که ترکیب داده ها و ارائه محصولات بر مبنای داده های قدیمی به نوعی نسخه برداری و ادغام غیرقانونی محسوب می گردد.
در حال حاضر، بحث درباره استفاده منصفانه در حوزه هوش مصنوعی همچنان داغ است. با این که OpenAI و بعضی دیگر از شرکت های فناوری استدلال می نمایند که استفاده از داده های عمومی به طور کلی مجاز و قانونی است، مخالفان می گویند که استفاده بدون اجازه از محتواهای تحت حق نشر، به حقوق نویسندگان و منابع اصلی آسیب می رساند. بالاجی از جمله کسانی است که معتقد است این شیوه برای اینترنت پایدار نیست و به زیست بوم اطلاعاتی اینترنتی ضربه می زند. او این شیوه را غیرقانونی و مخالف اخلاق کسب وکار می داند.
منبع
petapixel