در حال حاضر ما ابزارهای هوش مصنوعی مولدی داریم که میتوانند ببینند، بشنوند، صحبت کنند، بخوانند، بنویسند یا آثاری خلق کنند. در آیندهای نزدیک، هوشهای مصنوعی مولد قادر خواهند بود تا بسیاری از این کارها را به صورت همزمان انجام دهند؛ مثلا توانایی ایجاد متن و تصویر با هم.
به عنوان مثال، شنیده میشود که سومین نسخه ابزار تبدیل متن به تصویر Dall-E میتواند متن باکیفیتی را که در تصاویر تعبیه شده، تولید کرده و این کار را از رقبایش که ابزارهای تولید کننده تصویر هستند، بهتر انجام میدهد. در سال ۲۰۲۳ اعلام شد که ChatGPT حالا میتواند ببیند، بشنود، حرف بزند و بنویسد.
در نتیجه یکی از پیشبینیها در مورد هوش مصنوعی مولد، ادامه دادن همین مسیر به سمت هوشهای مصنوعی چند وجهی است که میتوانند به روشهای مختلف و در زمان واقعی دقیقا مثل مغز انسان شوند.
طبق گفته مصطفی سلیمان، یکی از بنیانگذاران DeepMind، گام بعدی فراتر از هوش مصنوعی مولد، "هوش مصنوعی تعاملی" خواهد بود. این به معنی رباتهایی است که دیگر فقط چت نمیکنند و میتوانند انواع و اقسام وظایف را با واگذاری به نرمافزارهای دیگر و حتی افراد انجام دهند تا کار شما را راه بیندازند.
مثلا توسعه نرمافزار را مدنظر داشته باشید. هوش مصنوعی مولد میتواند کدهای کامپیوتری بنویسد و آنها را آزمایش کند. این بدان معناست که میتوانید از آن برای ساختن یک برنامه دستور غذای جدید که برای تغذیه سالم طراحی شده استفاده کنید.
با تعاملیتر شدن هوش مصنوعی، از نظر تئوریک میتوانید یک هوش مصنوعی را با کل پروژه تولید برنامه (از نوشتن و آزمایش کد گرفته تا استخدام متخصصان تغذیه، عکاسان غذا و توسعهدهندگان دستور غذا که حتی میتوانند ربات باشند) و برقراری ارتباط با آزمایشکنندگان بتا، کارشناسان ساخت اپلیکیشن و سازماندهی کمپین بازاریابی به کار بگیرید. در یک مثال سادهتر، میتوانید از یک ربات مثل ChatGPT بخواهید تا برای یک شب برای سفر شما و همسرتان برنامهریزی کند (از پیدا کردن و رزرو یک هوتل گرفته تا انتخاب یک رستوران برای شما و رزرو کردن یک میز و اطلاع دادن به رستورانت در مورد اینکه به تخم مرغ آلرژی دارید گرفته تا حتی رزرو تور پیادهروی در شهر...) شما میتوانید همه این کارها را برعهده یک ربات قرار دهید.