В российской компании «Яндекс» сообщили, что данные, связанные с их технологиями, могли попасть в дата-сет для обучения нейросети DeepSeek. Это может объяснять, почему модель иногда воспроизводит информацию, относящуюся к «Яндексу», и ошибочно утверждает, что она является YandexGPT.
Во вторник в Telegram-каналах появились скриншоты с ответами DeepSeek на вопрос «Кто умнее, ты или ChatGPT4». Китайский чат-бот сначала утверждает, что он является YandexGPT, а потом говорит, что это было недоразумение из-за технической ошибки в данных или случайной путаницы во время обучения.
Это вызывает вопросы о том, насколько точно и объективно могут работать нейросети, особенно когда они сталкиваются с данными из разных источников. Также это подчёркивает важность контроля качества и проверки достоверности информации, используемой для обучения нейросетей.
Эксперты отмечают, что подобные случаи могут стать проблемой для разработчиков нейросетей и требуют более тщательного подхода к выбору и обработке данных. В то же время, это может стимулировать исследования в области искусственного интеллекта и разработки более совершенных алгоритмов.