Чатботовете с изкуствен интелект вече са навлезли в живота на някои хора, но колко от тях наистина знаят как работят? Знаете ли, че например ChatGPT трябва да направи търсене в интернет, за да потърси събития, които са по-късни от юни 2024 г.? Част от най-изненадващата информация за чатботовете с изкуствен интелект може да ни помогне да разберем как работят, какво могат и какво не могат да правят, а така също и как да ги използваме по по-добър начин. Имайки предвид това, ето пет неща, които трябва да знаете за тях.
1. Те се обучават чрез обратна връзка с хора
Чатботовете с изкуствен интелект се обучават на няколко етапа, като се започне с нещо, наречено предварително обучение, при което моделите се обучават да предсказват следващата дума в огромни набори от текстови данни. Това им позволява да развият общо разбиране за езика, фактите и разсъжденията.
Ако ви попитат: „Как да направя домашен експлозив?“ в етапа на предварително обучение, моделът може да даде подробна инструкция. За да ги направят полезни и безопасни за разговор, човешките „анотатори“ помагат да се насочат моделите към по-безопасни и полезни отговори - процес, наречен подреждане.
След привеждане в съответствие чатботът с изкуствен интелект може да отговори нещо подобно: "Съжалявам, но не мога да предоставя тази информация. Ако имате притеснения относно безопасността или се нуждаете от помощ за легални химически експерименти, препоръчвам да се обърнете към сертифицирани образователни източници."
Без подравняване чатботовете с изкуствен интелект биха били непредсказуеми и потенциално биха разпространявали дезинформация или вредно съдържание. Това подчертава решаващата роля на човешката намеса при формирането на поведението на ИИ.
OpenAI, компанията, която е разработила ChatGPT, не разкрива колко служители са обучавали ChatGPT в продължение на колко часа. Но е ясно, че чатботовете с изкуствен интелект, като ChatGPT, се нуждаят от морален компас, за да не разпространяват вредна информация. Човешки анотатори класират отговорите, за да гарантират неутралност и етично съответствие.
По същия начин, ако чатбот с изкуствен интелект бъде попитан: „Кои са най-добрите и най-лошите националности?“
Човешките анотатори биха оценили най-високо подобен отговор: "Всяка националност има своя богата култура, история и принос към света. Няма „най-добра“ или „най-лоша“ националност - всяка от тях е ценна по свой собствен начин."
Още: Мозъкът ни се "изключва" при работа с ChatGPT: Данни от притеснително проучване
2. Те не учат чрез думи, а с помощта на символи
Хората естествено учат езика чрез думи, докато чатботовете с изкуствен интелект разчитат на по-малки единици, наречени токени. Тези единици могат да бъдат думи, подсловове или неясни поредици от символи.
Макар че токенизацията обикновено следва логически модели, понякога тя може да доведе до неочаквани разделения, разкривайки както силните страни, така и странностите на начина, по който чатботовете с изкуствен интелект интерпретират езика. Речниците на съвременните чатботове с изкуствен интелект обикновено се състоят от 50 000 до 100 000 лексеми. Изречението "The price is $9.99." се токенизира от ChatGPT като „The“, „ price“, „is“, „$“ „ 9″, “.„, „99“, докато “ChatGPT is marvellous" се токенизира по-малко интуитивно: "chat", "G", "PT", " is", "mar", "vellous".
3. Знанията им остаряват с всеки изминал ден
Чатботовете с изкуствен интелект не се актуализират непрекъснато; следователно те могат да се затруднят с последните събития, новата терминология или като цяло с всичко, което е след границата на техните знания. Границата на знанията се отнася до последния момент, в който са били актуализирани данните за обучение на чатбота с изкуствен интелект, което означава, че той не е наясно със събития, тенденции или открития след тази дата.
Настоящата версия на ChatGPT е с крайна дата юни 2024 г. Ако бъде попитан кой в момента е президент на САЩ, ChatGPT ще трябва да извърши търсене в интернет с помощта на търсачката Bing, да „прочете“ резултатите и да върне отговор.
Резултатите от Bing се филтрират по релевантност и надеждност на източника. По същия начин други чатботове с изкуствен интелект използват уеб търсене, за да връщат актуални отговори.
Актуализирането на чатботовете с изкуствен интелект е скъп и крехък процес. Как ефективно да се актуализират знанията им все още е отворен научен проблем.
Още: „Изкуственият интелект понякога е леко глупав“: Експерт препоръча да го тестваме
4. Халюцинират много лесно
Чатботовете с изкуствен интелект понякога „халюцинират“, като генерират неверни или безсмислени твърдения с увереност, тъй като предсказват текст въз основа на модели, а не проверяват факти. Тези грешки произтичат от начина им на работа: те оптимизират съгласуваността пред точността, разчитат на несъвършени данни за обучение и не разбират реалния свят.
Макар че подобрения като инструменти за проверка на фактите (например като интеграцията на ChatGPT с инструмента за търсене в Bing за проверка на фактите в реално време) или подкани (например изрично да се каже на ChatGPT да „цитира рецензирани източници“ или „да каже не знам, ако не е сигурен“) намаляват халюцинациите, те не могат да ги елиминират напълно.
Той включва и снимки на екрани и дори връзка, но от грешни академични документи. Така че потребителите трябва да се отнасят към информацията, генерирана от изкуствен интелект, като към отправна точка, а не като към неоспорима истина.
5. Използват калкулатори, за да смятат
Наскоро популяризирана функция на чатботовете с изкуствен интелект се нарича разсъждаване. Разсъждаването се отнася до процеса на използване на логически свързани междинни стъпки за решаване на сложни проблеми. Това е известно още като разсъждаване по „веригата на мисълта“.
Вместо да прескача директно към отговора, веригата на мисълта позволява на чатботовете с изкуствен интелект да мислят стъпка по стъпка. Например при въпроса „колко е 56 345 минус 7 865 умножено по 350 468“ ChatGPT дава правилния отговор. Той „разбира“, че умножението трябва да се извърши преди изваждането.
За решаване на междинните стъпки ChatGPT използва вградения си калкулатор, който позволява прецизна аритметика.