ترجمه زبان حیوانات؛ انقلاب جدید ارتباطی با هوش مصنوعی

برقراری ارتباط با حیوانات از دیرباز یکی از علاقه‌مندی‌های انسان بوده است، اما امروز این خواسته دیگر تنها در حد یک کنجکاوی یا میل ارتباطی باقی نمانده و به یک تلاش عملی تبدیل شده است.

By
تصویری در خصوص تلاش‌ها برای ترجمه زبان حیوانات توسط هوش مصنوعی / عکس: هوش مصنوعی

در شرایطی که جهان با چالش‌های مختلف زیست‌محیطی روبرو است، پروژه‌های ترجمه، رمزگشایی و تحلیل زبان حیوانات با هوش مصنوعی به‌سرعت در حال توسعه هستند تا بلکه بتوانند تغییرات تدریجی در زیستگاه‌ها و رفتار گونه‌های حیوانی را چه در طبیعت و چه در محیط‌های انسانی، با دقت بررسی کنند.

مطالعات علمی نشان می‌دهد که حیوانات تغییرات در اکوسیستم زیستی خود، از جمله تحولات اقلیمی و محیطی، را به‌سرعت در الگوهای صوتی یا رفتاری منعکس می‌کنند.

در زیستگاه‌های طبیعی، تغییر در الگوی آواز پرندگان، کاهش یا افزایش ارتباطات صوتی پستانداران دریایی یا سکوت‌های غیرمعمول می‌تواند نشانه تغییر منابع غذایی، جابه‌جایی زیستگاه یا افزایش فشار انسانی باشد.

هوش مصنوعی با مقایسه این صداها در بازه‌های زمانی مختلف، به پژوهشگران کمک می‌کند روندهایی را شناسایی کنند که با مشاهده محدود انسانی به‌سختی قابل تشخیص است. این اطلاعات می‌تواند در مدیریت مناطق حفاظت‌شده و برنامه‌های حفاظت از گونه‌ها نقش عملی ایفا کند.

در کنار بقای حیات‌وحش، این رویکرد به رابطه انسان با حیوانات خانگی نیز گسترش یافته است. سگ‌ها و گربه‌ها بخش مهمی از زندگی شهری را تشکیل می‌دهند و رفتار و صداهای آن‌ها بازتاب مستقیمی از شرایط جسمی، روانی و محیط اطرافشان است.

تحلیل الگوهای صوتی این حیوانات خاگی می‌تواند به تشخیص زودهنگام استرس، ناراحتی یا تغییرات رفتاری کمک کند و ارتباط میان انسان و حیوان را دقیق‌تر و آگاهانه‌تر سازد، بی‌آنکه جایگزین تجربه یا قضاوت انسانی شود.

از سوی دیگر، بررسی صداهای جانوری، چه در طبیعت و چه در محیط‌های انسانی، به فهم بهتر تأثیر فعالیت‌های انسان کمک می‌کند. آلودگی صوتی، تغییر ریتم زندگی شهری یا مداخلات انسانی می‌تواند ارتباطات حیوانات را تحت تأثیر قرار دهد. تحلیل این تغییرات نشان می‌دهد کدام عوامل بیشترین اثر را دارند و چگونه می‌توان آن‌ها را بهتر مدیریت کرد.

در مجموع، پروژه‌های ترجمه زبان حیوانات با هوش مصنوعی نه ابزار پیش‌بینی قطعی‌اند و نه راه‌حل نهایی، بلکه روشی تازه برای دیدن رابطه انسان و حیوان از زاویه‌ای داده‌محور هستند؛ روشی که هم به حفاظت از حیات‌وحش کمک می‌کند و هم می‌تواند ارتباط روزمره انسان با حیوانات خانگی را آگاهانه‌تر و مسئولانه‌تر کند.

این فناوری نه تنها در جهت برداشتن مرزهای ارتباطی بین انسان و حیوانات عمل می‌کند، بلکه می‌تواند به حفاظت از گونه‌های در خطر انقراض، بهبود مراقبت از حیوانات خانگی، و حتی کشف رازهای تکاملی کمک کند.

پروژه‌های پیشرو در درک زبان حیوانات با هوش مصنوعی

در سال‌های اخیر، رمزگشایی و تحلیل زبان حیوانات با هوش مصنوعی از یک ایده صرفاً نظری به حوزه‌ای پژوهشی با پروژه‌های مشخص، فعال و جدی تبدیل شده است؛ حوزه‌ای که با حضور پژوهشگران برجسته و مشارکت مراکز علمی معتبر در حال گسترش است. اگرچه هنوز هیچ پروژه‌ای ادعای ترجمه کامل و انسانیِ زبان حیوانات را مطرح نمی‌کند، اما مجموعه‌ای از طرح‌های علمی توانسته‌اند ساختار ارتباطات غیرانسانی را به‌صورت نظام‌مند بررسی و مدل‌سازی کنند.

بیشتر پروژه‌هایی که در حوزه رمزگشایی و تحلیل زبان حیوانات با هوش مصنوعی توسعه یافته‌اند، در اصل با هدف حفاظت محیط‌زیست طراحی نشده‌اند، بلکه تمرکز اصلی آن‌ها بر فهم ساختارهای ارتباطی، شناخت رفتار جانوری و توسعه مدل‌های هوش مصنوعی بوده است. با این حال، اهمیت زیست‌محیطی این پروژه‌ها نه در نیت اولیه، بلکه در کاربردهای ثانویه و پیامدهای داده‌محور آن‌ها آشکار می‌شود.

در ادامه، به معرفی برخی از شاخص‌ترین پروژه‌های این حوزه پرداخته می‌شود تا ابعاد علمی و کاربردی این موضوع روشن‌تر شود.

محققان در پی رمزگشایی زبان نهنگ‌ها؛ پروژه CETI

پروژه CETI یکی از بزرگ‌ترین و جدی‌ترین تلاش‌ها برای رمزگشایی ارتباطات حیوانی است که در ایالات متحده و با مشارکت پژوهشگران اروپایی اجرا می‌شود. این پروژه با همکاری دانشگاه‌ها و مؤسسات تحقیقاتی مختلف و با حضور بیش از ۵۰ پژوهشگر از حوزه‌هایی چون زیست‌شناسی دریایی، هوش مصنوعی، زبان‌شناسی و رباتیک شکل گرفته است.

داده‌های صوتی و رفتاری گردآوری‌شده در این پروژه می‌تواند به درک بهتر واکنش نهنگ‌ها به تغییرات زیست‌محیطی، از جمله افزایش ترافیک دریایی یا آلودگی صوتی، کمک کند.

تمرکز CETI بر نهنگ‌های اسپرم است و هدف آن ثبت و تحلیل صداهای این گونه در کنار داده‌های رفتاری و محیطی است. دستاورد اصلی پروژه تاکنون، ایجاد اولین مجموعه داده چندبعدی از ارتباطات نهنگ‌ها است که در آن هر صدای ثبت‌شده همراه با اطلاعاتی مانند موقعیت مکانی، عمق، حرکت و واکنش سایر نهنگ‌ها ذخیره می‌شود. این رویکرد نشان داده است که برخی الگوهای صوتی با رفتارهای مشخص همبستگی معنادار دارند. امتداد این پروژه، حرکت از کشف الگو به سمت آزمون فرضیه‌های ارتباطی دقیق‌تر است.

یکی از دستاوردهای این پروژه آن است که نهنگ‌های اسپرم، صداهایی شبیه به واکه‌های  انسانی (مانند آ و ایی) تولید می‌کنند و حتی ساختارهایی شبیه به دیفتونگ (ترکیب واکه‌ها) دارند. این کشف نشان می‌دهد که ارتباطات نهنگ‌های عنبر، پیچیده‌تر از چیزی است که مطالعات قبلی نشان می‌داد و شباهت‌هایی با بلوک‌های ساختمانی زبان انسانی دارد.

وقتی مدل‌های زبانی به سراغ دلفین‌ها می‌روند؛ پروژه دلفین‌گما

یکی دیگر از پروژه‌های شاخص در این حوزه، پروژه DolphinGemma است که با همکاری پژوهشگران حوزه زیست‌شناسی دلفین‌ها و تیم‌های هوش مصنوعی وابسته به گوگل توسعه یافته است. این پروژه در ایالات متحده و در پیوند میان تحقیقات میدانی و مدل‌سازی پیشرفته اجرا می‌شود.

تحلیل ساختار ارتباطی دلفین‌ها می‌تواند نشانه‌هایی از تغییر رفتار این گونه در واکنش به شرایط محیطی یا انسانی را آشکار کند. چنین داده‌هایی در بلندمدت امکان مقایسه الگوهای ارتباطی دلفین‌ها در زیستگاه‌های مختلف و تحت فشارهای متفاوت را فراهم می‌کند.

هدف این پروژه آموزش یک مدل زبانی مبتنی بر صدا است که بتواند ساختار آواهای دلفین‌ها را بیاموزد. دستاورد اصلی دلفین‌گما این است که برای نخستین بار نشان داده مدل‌های الهام‌گرفته از مدل‌های زبانی انسانی می‌توانند روی ارتباطات یک گونه غیرانسانی نیز آموزش ببینند.

این مدل توانسته الگوهای تکرار و ترتیب صداها را یاد بگیرد و حتی توالی‌های صوتی جدیدی تولید کند که از نظر ساختاری به صداهای دلفین شباهت دارند. امتداد این پروژه، بررسی واکنش دلفین‌ها به این الگوهای مصنوعی در چارچوب‌های کاملاً کنترل‌شده است.

ساخت یک مغز صوتی عمومی برای طبیعت؛ پروژه گونه‌های زمینی

یکی دیگر از پروژه‌ها، گونه‌های زمین یا Earth Species Project نام دارد که ‌هم‌نام یک نهاد پژوهشی غیرانتفاعی مستقر در ایالات متحده است. تمرکز پروژه بر رمزگشایی ارتباطات گونه‌های مختلف جانوری با استفاده از هوش مصنوعی است. یکی از خروجی‌های مهم این پروژه، مدل NatureLM-audio است.

مدل‌های عمومی صوتی این پروژه ظرفیت آن را دارند که صداهای جانوری را به شاخصی برای سنجش وضعیت اکوسیستم‌ها تبدیل کنند. این رویکرد می‌تواند در پایش تنوع زیستی و شناسایی تغییرات تدریجی در زیستگاه‌های طبیعی کاربرد داشته باشد.

این مدل به‌عنوان یک مدل عمومی صوتی طراحی شده و روی حجم بزرگی از صداهای جانوری آموزش دیده است. دستاورد اصلی NatureLM-audio اثبات این نکته است که می‌توان یک زیرساخت واحد برای تحلیل صداهای طبیعت ایجاد کرد، بدون آنکه برای هر گونه یک مدل کاملاً مجزا ساخته شود. امتداد این پروژه، تطبیق این مدل عمومی با گونه‌های خاص و کاربردهای حفاظتی و پژوهشی است.

وقتی صدای فیل‌ها مستند می‌شود؛ پروژه صدای‌فیل‌ها

پروژه ElephantVoices با تمرکز بر فیل‌ها و با مشارکت پژوهشگران بین‌المللی اجرا می‌شود. این پروژه یک بانک صوتی–رفتاری ایجاد کرده که شامل صدها نوع صدای ثبت‌شده و هزاران نمونه رفتاری است.

دستاورد آن، مستندسازی نظام‌مند ارتباطات صوتی فیل‌ها و پیوند دادن صدا با موقعیت‌های رفتاری مشخص است.

مستندسازی دقیق صداهای فیل‌ها امکان بررسی تأثیر تخریب زیستگاه یا تعارض انسان و حیات‌وحش بر رفتار این گونه را فراهم می‌کند. این داده‌ها می‌تواند در برنامه‌ریزی حفاظتی و مدیریت مناطق محل زندگی فیل‌ها مورد استفاده قرار گیرد.

شنیدن آنچه انسان نمی‌شنود؛ DeepSqueak و رمزگشایی صداهای فراصوت

پرو‌ژه دیگر، DeepSqueak نام دارد که پروژه‌ای دانشگاهی در ایالات متحده است که بر تحلیل صداهای فراصوت جوندگان تمرکز دارد. این سامانه با یادگیری عمیق، هزاران صدای بسیار زیر را که برای انسان قابل شنیدن نیست، شناسایی و طبقه‌بندی کرده است.

دستاورد اصلی DeepSqueak نشان دادن این واقعیت است که بخش مهمی از ارتباطات جانوری خارج از محدوده شنوایی انسان رخ می‌دهد. امتداد این پروژه، کاربرد گسترده‌تر در علوم اعصاب و رفتارشناسی حیوانات است.

اگرچه تمرکز این پروژه بر محیط‌های آزمایشگاهی است، اما روش‌های آن نشان می‌دهد که چگونه صداهای بسیار ظریف می‌توانند بازتابی از وضعیت زیستی و استرس حیوانات باشند. این رویکرد می‌تواند در مطالعات محیطی برای تشخیص اثر عوامل بیرونی بر رفتار جانوران الهام‌بخش باشد.

رمزگشایی صدای پرندگان؛ پروژه BirdNET

پروژه BirdNET حاصل همکاری دانشگاه کرنل در ایالات متحده و دانشگاه صنعتی کمنیتس در آلمان است. این سامانه برای تشخیص و شناسایی صدای پرندگان با استفاده از شبکه‌های عصبی توسعه یافته است.

کاربرد گسترده BirdNET امکان پایش جمعیت پرندگان و تغییرات گونه‌ای را در مقیاس‌های بزرگ فراهم کرده است. این داده‌ها به‌طور عملی در ارزیابی تنوع زیستی و شناسایی مناطق در معرض تغییرات محیطی استفاده می‌شوند.

دستاورد BirdNET تبدیل یک ابزار پژوهشی به فناوری کاربردی است که هم در تحقیقات علمی و هم در ابزارهای عمومی استفاده می‌شود. این پروژه نشان داده تشخیص خودکار صدا می‌تواند با دقت بالا و در مقیاس وسیع انجام شود. امتداد آن، گسترش به سایر گونه‌هاست.

فراتر از رمزگشایی آواز پرندگان؛ پروژه Perch

پروژه Perch و نسخه پیشرفته‌تر آن Perch 2.0 توسط تیم‌های پژوهشی مرتبط با گوگل دیپ‌مایند و نهادهای دانشگاهی در بریتانیا و ایالات متحده توسعه یافته‌اند.

قابلیت تعمیم این مدل‌ها به گونه‌های مختلف، امکان پایش هم‌زمان چندین گروه جانوری را فراهم می‌کند. چنین ظرفیتی برای رصد تغییرات تنوع زیستی و بررسی روندهای بلندمدت محیط‌زیستی اهمیت دارد.

این پروژه‌ها در ابتدا با تمرکز بر تشخیص صدای پرندگان شکل گرفتند، اما دستاورد مهم آن‌ها نشان دادن قابلیت تعمیم مدل‌ها به گونه‌های دیگر است. نتایج نشان می‌دهد مدلی که برای پرندگان آموزش دیده، می‌تواند در تحلیل صداهای سایر حیوانات نیز عملکرد قابل قبولی داشته باشد. امتداد این مسیر، استفاده از این مدل‌ها برای پایش تنوع زیستی در مقیاس‌های بزرگ است.

رمزگشایی صدای سگ‌ها؛ پروژه ELTE

این پروژه در دانشگاه اوتووش لوراند (ELTE) مجارستان و توسط پژوهشگران حوزه رفتارشناسی جانوری و علوم شناختی اجرا شده است.

خروجی اصلی پروژه، تحلیل هزاران نمونه پارس سگ در موقعیت‌های مختلف مانند تنهایی، بازی، هشدار و حضور صاحب بوده است.

پژوهشگران این پروژه نشان داده‌اند که پارس سگ‌ها بسته به موقعیت، دارای الگوهای صوتی قابل تفکیک است و می‌توان با یادگیری ماشین میان حالت‌های کلی رفتاری تمایز قائل شد. این پروژه تأکید می‌کند که هدف آن ترجمه زبان سگ نیست، بلکه تشخیص وضعیت و زمینه رفتاری از روی صدا است.

تفسیر صدای گربه‌ها برای انسان؛ MeowTalk

پروژه اپلیکیشن MeowTalk ابتدا در ایالات متحده و با مشارکت پژوهشگران و توسعه‌دهندگان حوزه هوش مصنوعی و رفتارشناسی حیوانات شکل گرفت و بعدها به یک ابزار کاربردی تبدیل شد.

خروجی این پروژه، مدلی مبتنی بر یادگیری ماشین است که صداهای گربه را دسته‌بندی کرده و آن‌ها را به حالت‌های کلی مانند درخواست غذا، ناراحتی یا جلب توجه نسبت می‌دهد.

این پروژه ادعا نمی‌کند زبان گربه‌ها را ترجمه می‌کند، بلکه می‌گوید بر اساس الگوهای تکرارشونده صوتی، می‌توان برداشت احتمالی از نیاز یا وضعیت گربه ارائه داد؛ برداشتی که بدون زمینه رفتاری قطعی نیست.

پوشیدنی هوشمند برای فهم وضعیت حیوان؛ PetPace

پروژه PetPace در ایالات متحده توسعه یافته و با همکاری دامپزشکان و متخصصان داده شکل گرفته است.

خروجی اصلی آن یک قلاده هوشمند است که داده‌هایی مانند فعالیت بدنی، الگوی خواب، دمای بدن و در برخی مدل‌ها صدا را ثبت و تحلیل می‌کند.

این پروژه بر این فرض استوار است که تغییرات رفتاری و فیزیولوژیک حیوان می‌تواند نشانه زودهنگام استرس یا بیماری باشد و هوش مصنوعی می‌تواند این تغییرات را پیش از مشاهده انسانی شناسایی کند. تمرکز PetPace بر سلامت و رفاه حیوان است، نه ارتباط زبانی.

تشخیص احساس از صدای حیوانات خانگی

این مسیر پژوهشی در چند دانشگاه اروپایی و آمریکایی، از جمله در مطالعات دامپزشکی و علوم رفتاری دنبال شده است.

خروجی این پروژه‌ها، مدل‌هایی هستند که تلاش می‌کنند از روی ویژگی‌های صوتی، میان حالت‌های احساسی کلی مانند مثبت یا منفی تمایز قائل شوند.

این پژوهش‌ها نشان می‌دهند که صدا می‌تواند بازتابی از وضعیت احساسی حیوان باشد، اما تأکید دارند که تشخیص احساس به معنای فهم پیام یا نیت زبانی نیست.

تحلیل رفتار ترکیبی سگ و گربه

این پروژه‌ها که در مراکز پژوهشی و استارتاپی در آمریکای شمالی و اروپا توسعه یافته‌اند، بر ترکیب داده‌های صوتی، حرکتی و رفتاری تمرکز دارند.

خروجی آن‌ها سیستم‌هایی است که رفتار حیوان را در طول زمان تحلیل کرده و تغییرات غیرعادی را گزارش می‌کنند.

منطق این پروژه‌ها بر این پایه است که فهم حیوانات خانگی تنها از طریق صدا ممکن نیست و رفتار، حرکت و ریتم زندگی نقش تعیین‌کننده دارند.

این تحقیقات، تنها بخشی از پروژه‌ها و تلاش‌های علمی در حوزه درک و تحلیل زبان حیوانات با هوش مصنوعی است. در سال‌های اخیر، پژوهش‌های متعددی در دانشگاه‌ها، مؤسسات تحقیقاتی و آزمایشگاه‌های مستقل در نقاط مختلف جهان در جریان است که هر یک از زاویه‌ای متفاوت به ارتباطات جانوری می‌پردازند.

بزرگ‌ترین آرشیوهای حیات‌وحش جهان

در راستای رمزگشایی و ترجمه زبان حیوانات، کتابخانه‌های صوتی مختلفی نیز در سراسر جهان وجود دارند که آرشیو غنی از انواع صداهای جانوران در آن گرد‌آوری شده است. یکی از این کتابخانه‌های صوتی Macaulay، وابسته به دانشگاه کرنل در ایالات متحده است و یکی از بزرگ‌ترین آرشیوهای حیات‌وحش جهان محسوب می‌شود. این آرشیو شامل ده‌ها میلیون فایل صوتی، تصویری و ویدئویی از گونه‌های مختلف است.

دستاورد این پروژه، پیوند دادن صدا با تصویر و رفتار در یک چارچوب آرشیوی منسجم است. این امکان به پژوهشگران اجازه می‌دهد ارتباط میان صدا و زمینه رفتاری را دقیق‌تر بررسی کنند. امتداد این مسیر، استفاده گسترده‌تر از این داده‌ها در آموزش مدل‌های چندوجهی است.

یکی دیگر از این پایگاه‌ها، xeno-canto است که یک پروژه مشارکتی بین‌المللی است که با محوریت مراکز پژوهشی اروپایی اداره می‌شود. این پایگاه تاکنون بیش از یک میلیون فایل صوتی از حدود ۱۳ هزار گونه جانوری را گردآوری کرده است.

دستاورد اصلی xeno-canto ایجاد یکی از بزرگ‌ترین آرشیوهای آزاد صدای حیات‌وحش در جهان است. این داده‌ها زیربنای آموزش بسیاری از مدل‌های هوش مصنوعی در حوزه ارتباطات جانوری را فراهم کرده‌اند. امتداد این پروژه، افزایش پوشش گونه‌ها و بهبود کیفیت برچسب‌گذاری داده‌هاست.

آینده تحقیقات در رمزگشایی زبان حیوانات با هوش مصنوعی

مسیر پژوهش در حوزه درک و تحلیل ارتباطات جانوری با هوش مصنوعی به‌سرعت در حال حرکت از شناسایی الگوها به سمت تحلیل زمینه‌محور است. پژوهشگران در سال‌های آینده تمرکز خود را بیش از پیش بر ترکیب داده‌های صوتی با اطلاعات رفتاری، مکانی و محیطی خواهند گذاشت تا ارتباطات حیوانات نه به‌صورت منفک، بلکه در بستر واقعی زیستگاه‌ها تفسیر شود.

یکی از محورهای اصلی آینده این تحقیقات، توسعه مدل‌های چندوجهی است؛ مدل‌هایی که صدا، حرکت، تصویر، داده‌های زیستی و شرایط محیطی را هم‌زمان تحلیل می‌کنند. چنین رویکردی می‌تواند امکان تشخیص زودهنگام تغییرات اکولوژیک، استرس جمعی گونه‌ها یا واکنش حیوانات به فشارهای انسانی را با دقت بالاتری فراهم کند.

در عین حال، پژوهش‌ها به سمت ایجاد مدل‌های عمومی‌تر پیش می‌روند؛ سامانه‌هایی که به‌جای تمرکز بر یک گونه خاص، بتوانند الگوهای ارتباطی مشترک میان گونه‌های مختلف را شناسایی کنند. این تحول می‌تواند تحلیل صداهای طبیعت را به ابزاری مقیاس‌پذیر برای پایش تنوع زیستی در سطح منطقه‌ای و جهانی تبدیل کند. با این حال، محدودیت‌های علمی و اخلاقی همچنان پابرجاست.

انتظار می‌رود نتایج این تحقیقات بیش از آنکه به گفت‌وگوی مستقیم انسان و حیوان منجر شود، در خدمت سیاست‌گذاری‌های محیط‌زیستی، مدیریت مناطق حفاظت‌شده و بازتعریف رابطه انسان با طبیعت قرار گیرد؛ رابطه‌ای که این بار بر پایه داده، مسئولیت‌پذیری و فهم عمیق‌تر از زیست‌بوم‌های مشترک بنا می‌شود.

 

این نوشته توسط یکی از همکاران فریلنسر تی‌آرتی فارسی به رشته تحریر درآمده است. نظرات بیان شده در این نوشته نظر نویسنده مطلب است و الزاما بازتاب رویکرد تی‌آرتی فارسی نمی‌باشد.