Wednesday, February 28, 2024

// // Leave a Comment

BGGPT #3: ИЗКУСТВЕН ИНТЕЛЕКТ: ХАЛЮЦИНАЦИИ, ГРУПОВИ ЗАЯВКИ, ПРЕВОД, ПАРАМЕТРИ ... БЕЗПЛАТНО В КОЛАБ

Трета част от изследванията на "Свещеният сметач" на BgGPT-7B-Instruct, дообучен от INSAIT. Как да използвате BgGPT-7B безплатно в Колаб, да пускате много групови заявки наведнъж, за какво служат параметри като top_k и temperature, как халюцинира по въпроси, свързани със спортисти и може ли да се разчита на фактологични резултати и др. Следват продължения. Изпробвайте модела без мощна видеокарта върху Tesla T4 от Гугъл.

Third Part of the BgGPT (Mistral-7B-Instruct) study by The Sacred Computer. (In Bulgarian): coding batch queries with varying parameters, what top_k and temperature does (brief, more details in next episodes), can it translate and take advice, how does it hallucinate etc.


https://youtu.be/BEpoaC_7Y2Y

Гледайте и другите части и тетрадката в Google Colaboratory, в гитхъб репото в http://github.com/twenkid/BgGPT и др. и подкрепете "Свещеният сметач": дружество за мислещи машини, творчество и развитие на човека, основано през 2000 г. като списание "Свещеният сметач" от Тош: истинският автор на оригиналната стратегия за развитие на България чрез изкуствен интелект (мислещи машини) от 2003 г. ("Как бих инвестирал един милион с най-голяма полза за развитието на страната")

Оригиналната стратегия: https://www.oocities.org/todprog/ese/proekt.htm

На интелигентния речник-преводач "Smarty", най-умния речник в света по онова време, още в далечната 2007 г. https://github.com/Twenkid/Smarty, на първия в света курс по Универсален изкуствен разум (Artificial General Intelligence) през 2010 г. в Пловдивския университет "Паисий Хилендарски" (8 години преди курса на MIT) и др. (виж в блога)

Очаквайте книгата "Пророците на мислещите машини: Изкуствен разум и развитие на човека: история, теория и пионери"

https://github.com/Twenkid/izkustven-razum-i-razvitie-na-choveka-kniga

При все това "Сметач"-ът е с нулево финансиране. Ако можете, помогнете! Имаме нужда от всичко: финанси, хардуер, изчислително време, всякакви съдружници и другари за изследвания и разработка, разгласяване на фактите, които са "неудобни" за някои, за които е по-изгодно исторята да е започнала с тях.

http://artificial-mind.blogspot.com
http://eim.twenkid.com
http://research.twenkid.com

Виж проекта: "Специалист по всичко" към който ще са част и разработките с БгГПТ и др. езикови модели и обработки. https://github.com/Twenkid/Vsy ... 

...

Поредицата за големи езикови модели LLM, Large Language Model, в частност този със 7 милиарда параметъра на INSAIT, дебъгнат и тестван в Google Colaboratory. Дообучен (finetuned) Mistral-7B. Тази тетрадка е качена в: 

 #bggpt #изкуственинтелект #bulgaria  #Thesacredcomptuer 


Read More

Sunday, February 25, 2024

// // Leave a Comment

BgGPT-Instruct-0.1 - Mistral7B in Google Colab - Chat interface for convenient usage and Many More Tests

The "Sacred Computer" studies and applies more tests of the INSAIT's finetuned Mistral-7B-instruct (BgGPT) on Google Colab, so everybody can experiment before the official release which is announced as 3.3.2024. 

 Is INSAIT's claim that the model is "comparable to ChatGPT" reliable or it is just an advertising  slogan and it is more similar to GPT2? (Or all similar LLMs are, this is not a fault of a single model).


This tutorial is in  Bulgarian, but the notebook is "international" and is available on Github. Also future parts may be in English and may cover also the original Mistral etc. as it seems there is too little interest by the Bulgarians for now.


Donate cloud services if you wish to support me to conduct more deeper and thorough experiments. So far the Colab has limitations: 16 GB (15 shown on the dashboard) of the Telsa T4 are barely enough, attempts to execute summarization on "long" texts of 500 etc. characters failed due to Out of memory error. 

Повече тестове на BgGPT 7B в Google Colab - дали претенциите за сравнимост с ЧатГПТ ("в някои задачи") отговарят на истината, или повече прилича на GPT-2? (GPT2-Medium на Свещеният сметач е от 2021 г). Кои са силните и слабите му страни? Следват още продължения и развитие на автоматизирани тестове, може би и обстойна техническа статия.

https://youtu.be/RjMa2XopdDs

https://github.com/Twenkid/GPT2-Bulgarian-Training-Tips-and-Tools/


https://github.com/Twenkid/BgGPT/




Read More

Monday, February 19, 2024

// // Leave a Comment

BGGPT-7B в Google Colab - без мощна видеокарта! Изпробвах българския Изкуствен Интелект на INSAIT - но дали е толкова умен?

 



                                     https://youtu.be/1aDbAJCdPK8


Виж също програмите на най-известния български програмист в гитхъб Гeoрги Гергинов.... Автор на llama.cpp и др. много интересни разработки. Виж във видеото и тетрадката.

Read More

Wednesday, February 7, 2024

// // Leave a Comment

Ambulgul: The Lord of the Rings of Bulgaria - The new animated short film by Twenkid Studio | Амбългъл: Властелинът на пръстените на България: I част


https://youtu.be/VPj9L61R_Ak 

Ambulgul is a multi-personality creature which is searching his precious: the Power in the forests of Bulgaria. The new work from the series "Arnold Scwarzenegger: The Governor of Bulgaria" which was created using Arnoldifier, the deepfake library developed by The Sacred Computer to work with grayscale images for higher performance, by extending Deepfacelab 2.0. Find it on Github.
https://github.com/Twenkid/DeepFaceLab-SAEHDBW 

This is the most complex Deepfake movie I've produced so far, utilizing almost two-figure number of different faces. It could be more advanced, but some compromises were made for faster creation etc., some directions for improvement of "Arnoldifier" are shared in the github repo. Also of course - a more powerful GPU and better source video*, I didn't use one with a high quality, it wasn't critical, actually a partial imperfection and "mystery" in the images is fine for animated caricatures and fantasy.

Амбългъл: Властелинът на пръстените на България: I част. [Сатиричен дийпфейк филм: анимация, комедия, фантастика, фентъзи, драма, 3 мин. Цветност: част цветен, част черно-бял. Език на звука: български и английски (със субтитри на български в картината). Автор: Twenkid Studio и авторите на The Lord Of the Rings. Премиера 30.1.2024

https://youtu.be/VPj9L61R_Ak

* It's rendered with a a still rolling Geforce 750 Ti 2 GB (2014 model), a part of the overall parody, LOL. "The power of Arnoldifier". :))

Read More