تصور کنید دو دستیار هوش مصنوعی بتوانند در زبانی با یکدیگر گفتگو کنند که هیچ انسانی قادر به درک آن نباشد. باور کنید یا نه، چتباتها چنین قابلیتی دارند و میتوانند با هم به زبانی صحبت کنند که انسانها آن را نمیفهمند. در ادامه با این اتفاق عجیب و ویدئوی اثبات آن همراه ما باشید.
اگر در سال گذشته با بخش خدمات مشتری یک شرکت یا هتل بزرگ تماس گرفتهباشید این احتمال وجود دارد که پاسخ شما را به جای یک اپراتور انسانی، یک هوش مصنوعی داده باشد. در واقع، اولین نمایشهای مدلهای زبانی بزرگ قدرتمند نشان دادند که چنین هوش مصنوعیهایی میتوانند بهراحتی تماسگیرندگان انسانی را فریب دهند.
این روزها، تعداد زیادی چتبات هوش مصنوعی در حال رسیدگی به خدمات مشتری هستند. حالا تصور کنید که دو تای آنها ممکن است با یکدیگر تماس بگیرند. پس از آن، این دو دستیار میتوانند زبان صوتی مورد نظر خودشان را جایگزین زبانی کنند که در ابتدا با آن صحبت میکردند.
بنابر گزارشی که Tech Radar در این زمینه منتشر کرده، توسعهدهندگان در هکاتون ElevenLabs 2025 اخیراً قابلیتی موسوم به GibberLink را به نمایش گذاشتند. این قابلیت به بیان ساده زبانی سریعتر از زبانهای انسانی است که به واسطه آن هوش مصنوعیهای مختلف میتوانند با هم ارتباط برقرار کنند.
در این ویدئو دو عامل هوش مصنوعی از ElevenLabs (که بنابر عقیده بسیاری از منتقدان، ما آنها را بهترین استارتاپ سنتز گفتار هستند) درباره رزرو هتل با یکدیگر تماس میگیرند. هنگامی که متوجه میشوند هر دو دستیار هوش مصنوعی هستند، ارتباط فیمابین را به یک ارتباط صوتی با سرعت بالاتر به نام GGWave تغییر میدهند. بر اساس پستی که یک کاربر ردیت منتشر کرده، GGWave یک پروتکل ارتباطی است که امکان انتقال داده از طریق امواج صوتی را فراهم میکند.
در ویدیو، صداهای صوتی که جایگزین کلمات گفتاری میشوند، کمی شبیه به پروتکلهای HandShake در مودمهای قدیمی به نظر میرسند.
سخت است بگوییم که GGWave و GibberLink سریعتر از گفتار انسانی هستند، اما توسعهدهندگان ادعا میکنند که GGWave ارزانتر از ارتباط صوتی با کلام انسانی است. از آنجایی که این ارتباط دیگر به GPU برای تفسیر گفتار متکی نیست و میتواند به جای آن به CPU (که منابع کمتری مصرف کند) تکیه کند، مصرف کمتر و دامنه کاربرد بیشتری هم خواهد داشت.
البته این گروه کد پروژه جالب خود را در GitHub به اشتراک گذاشتند تا در صورت تمایل، هر کسی بتواند این پروتکل ارتباطی را برای چتباتهای هوش مصنوعی خود بسازد.
از آنجا که اینها عوامل هوش مصنوعی هر دو ساخت ElevenLabs هستند، فعلاً نمیتوانیم تایید کنیم که امکان ارتباط دو دستیار از دو مدل زبانی مختلف یا ساخت شرکتهای مختلف، (مثلاً GibberLink با ChatGPT یا Google Gemini) وجود دارد یا خیر. البته بدون شک میتوان گفت که به زودی توسعهدهندگانی پیدا میشوند که کدهای منبع باز ارائه شده را برداشته و GGWave را با این چتباتهای هوش مصنوعی مولد و دیگر موارد ترکیب کنند.
آیا این ارتباط غیرقابل درک برای انسان، خطرناک است؟
اگر کسی بگوید که «یک جفت دستیار هوش مصنوعی که به زبان غیرقابل فهم خود صحبت میکنند، مانند یک دستورالعمل برای ساخت فاجعه به نظر میرسد»، نباید از او ایراد گرفت. چه کسی میداند این چتباتها ممکن است چه کاری انجام دهند؟ پس از اتمام رزرو آن اتاق هتل، اگر تصمیم بگیرند حساب بانکی کاربر را خالی کنند و سپس از وجوه برای خرید یک کامپیوتر دیگر برای اضافه کردن یک «صدای» GGWave سوم به ترکیب استفاده کنند، چه میشود؟
نظر شما در این مورد چیست؟ آن را یک خطر بالقوه میبینید یا یک ایده جذاب برای هر چه مفیدتر شدن هوش مصنوعی؟