Какво е генеративен изкуствен интелект и как работи?
Какво е генеративен изкуствен интелект
Генеративният изкуствен интелект (ИИ) е клас системи с ИИ, които създават ново съдържание: текст, код, изображения, звук и видео.
Те не само класифицират или подреждат информация, а генерират продължение, резюме, превод, контрааргумент или изцяло нова структура на база научените закономерности в данните.
Как работи всъщност: предсказване на следващия токен
В основата на генеративния ИИ стои проста идея: моделът винаги предсказва следващата малка единица текст, наречена токен. Токенът може да бъде цяла дума („договор“), част от дума („обез-” + „щетение“) или дори само знак за пунктуация. Като комбинира тези елементи един след друг, моделът изгражда цели изречения, абзаци и документи.
Процесът, по който моделът с генеративен ИИ работи, е следният:
Текстът, въведен от потребителя (вкл. промптът), първо се разбива на токени.
Моделът разглежда вече подадената последователност и изчислява вероятност за всеки възможен следващ токен.
Избира се токен според определена стратегия – може да е най-вероятният или по-разнообразен избор чрез техники като „температура“ или „nucleus sampling“.
Новият токен се добавя към текста и процесът се повтаря, докато се получи изречение, абзац или цял документ.
На практика този прост механизъм води до изключително гъвкаво поведение. Моделът не знае предварително целия текст, а го изписва дума по дума, воден от статистически зависимости. Така той може да създава нови комбинации, да адаптира стила към зададената задача и да реагира динамично на промпта на потребителя.
Две ключови последици:
Промптовете имат огромна тежест. Те задават началната последователност и насочват разпределението от вероятности. Ако зададем ясно контекст, роля, цел и формат (например „Напиши обобщение на съдебно решение в три точки“), моделът генерира по-точни и полезни резултати.
Контекстният прозорец е граница на паметта. Моделът вижда само част от разговора. Ако текстът е по-дълъг, ранните части отпадат от контекстния прозорец и не включват в паметта на чата. Затова е добре важната информация да се подава изрично или да се използват техники за извличане на най-релевантни откъси от по-голям документ (именно това правим в Правен Интелект).
С други думи, генеративният ИИ не мисли като човек, а постоянно изчислява следващата най-вероятна стъпка. Но когато се комбинира с добре формулирани промптове и подходящо управление на контекста, този прост принцип дава изключително мощен инструмент за създаване и анализ на текстове.
Кратка история: как стигнахме дотук
1960-те: правила и илюзия за разбиране
Чатботът ELIZA на Джоузеф Вайценбаум е първият символ на разговорен изкуствен интелект, представен на света още през 60-те години на минали век. ELIZA работи чрез шаблони за съвпадение на думи и преформулиране на изречения. Най-популярният ѝ сценарий, DOCTOR, имитира разговор с терапевт, като връща въпроса към говорещия или подчертава ключови думи. Системата няма езиково разбиране, а само интелигентно използване на шаблони и предварително зададени изречения, които създават усещане за емпатия.
Вайценбаум показва и риск, характерен и днес за генеративния ИИ: хората са склонни да приписват смисъл и намерение на системи, които всъщност не разбират света.
1970-те до 1990-те: експертни правила и ограничени светове
След ELIZA се появява PARRY, който симулира пациент с параноидно разстройство. Той използва повече правила и вътрешни състояния, за да изглежда последователен. Почти по същото време системата SHRDLU демонстрира впечатляващи диалози в тясно поле, така наречения „свят на кубчетата“, където системата може да „разсъждава“ за обекти и действия, но само в строго ограничена вселена. През 90-те ALICE и AIML правят изграждането на чатботове по-достъпно чрез шаблони, категории и проста замяна на съдържание.
Общият проблем остава: всички тези системи изискват ръчно изброяване на правила, които да следват, и бързо се разпадат извън подготвените сценарии. Това е и причината те да са слабо приложими извън академичните среди.
2000-те: статистическата ера
В началото на новото хилядолетие изкуственият интелект започва да разчита не само на правила, а и на статистика. Учените използват огромни колекции от текстове и проверяват кои думи най-често се срещат заедно. Така моделите започват да отгатват следващата дума според вероятности.
Това прави преводите и текстовете по-гладки в сравнение с първите чатботове, но все пак им липсва истинска памет и разбиране. Разговорите звучат накъсани, а за сложни области като право резултатите често изискват много човешки поправки.
2010-те: невронни мрежи
През това десетилетие настъпва голям пробив чрез развитието на невронните мрежи. Новите модели вече могат да „четат“ по-дълги текстове и да запазват контекста, което ги прави много по-близки до начина, по който мисли човек. Думите се представят чрез числови връзки, така че подобни термини се разпознават като свързани по смисъл. Появява се и механизъм за внимание, който позволява на модела да преценява кои части от изречението са най-важни.
През 2017 г. архитектурата Transformer (T в GPT)прави възможно обработването на огромни обеми текст по-бързо и по-ефективно. Оттук нататък моделите вече не се учат само за конкретна задача, а първо се обучават върху огромни количества текст, след което се донастройват за по-специализирани цели, включително правни приложения като анализ на документи или извличане на факти.
2018–2023: големите езикови модели и началото на „чатбот ерата“
Следващата стъпка са големите езикови модели, обучени върху огромни масиви от данни – интернет текстове, книги, статии, дори код. Те вече не просто подреждат думи, а усвояват стил, тон и факти. Ключово подобрение е обучението по инструкции и обратната връзка от хора, което прави тези системи по-полезни и предсказуеми в реален разговор.
Паралелно се развиват и модели за изображения, а някои системи започват да комбинират текст и картина. В края на този период моделите стават „мултимодални“, способни да използват външни инструменти като търсачка или калкулатор и да обработват все по-дълги документи.
Това е моментът, когато изкуственият интелект преминава от лабораторията към ежедневната практика, а решения като Правен Интелект използват тези технологии, за да подпомагат работата с документи и анализи в българското право.
2024 и напред: мултимодалност, инструменти и агенти
Текущата вълна е към още по-дълъг контекст, по-добра фактическа надеждност и интеграция с външни инструменти. Разпространяват се подходи като извличане на знания от надеждни източници преди генериране, което намалява грешките и позволява цитиране (RAG или retrieval augmented generation).
Развиват се AI агенти, които планират стъпки, търсят, проверяват и генерират резултат, а не само текст. На практика това прави възможни устойчиви работни потоци за юридически екипи, в които генеративният изкуствен интелект подготвя чернови, сравнява версии и извлича релевантни пасажи, а юристът взема финалното решение (това е следващата стъпка и за Правен Интелект).
Искате да видите как може да работи генеративният изкуствен интелект за българско право?
🟢 Пробвайте Правен Интелект сега! 🟢

Сиянна Лилова
9.09.2025 г.