Egalware/chat-proxy

T

Samuele E. Locatelli 081576c4a1 Fix grafici output

2025-09-03 16:46:47 +00:00

Update per gestione condensazione history messaggi

2025-09-03 16:19:06 +00:00

Fix grafici output

2025-09-03 16:46:47 +00:00

Fix grafici output

2025-09-03 16:46:47 +00:00

Add services configured, add Streamlit client for interactive chatbot

2025-08-21 13:36:39 +00:00

Update progetto

2025-09-03 06:42:58 +00:00

.gitignore

Add gitignore file

2025-08-21 11:18:35 +02:00

Copilot_20250822_144055.png

Update readme con IMG

2025-08-22 15:20:44 +02:00

package-lock.json

Fix grafici output

2025-09-03 16:46:47 +00:00

package.json

Fix grafici output

2025-09-03 16:46:47 +00:00

README.md

update readme

2025-09-03 17:43:23 +02:00

README.pdf

update readme

2025-09-03 17:43:23 +02:00

start-frontend.sh

Update varie

2025-08-21 10:37:58 +00:00

start-streamlit.sh

Add services configured, add Streamlit client for interactive chatbot

2025-08-21 13:36:39 +00:00

README.md

chat-proxy

Progetto di web chat verso motore LLM (proxy) per task chat e supporto coding privato/riservato.

Obiettivi generali

L'obiettivo iniziale è avere un agente AI basato su soluzioni opensource

da eseguire localmente su HW presente in ufficio
dove poter effettuare chiaamte anche con codice sorgente proprietario senza temere di inviare info riservate esternamente
per poter avere un agente sempre disponibile con le risorse allocate
da poter successivamente addestrare con risorse interne tra cui
- wiki
- sorgenti di codice aziendale

Setup soluzione

La soluzione è basata sul seguente stack

LM Studio per esecuzione modello LLM locale (al momento su workstation Sam + scheda video AMD e poi NVidia)
Abilitazione LM Studio x chiamate locali su porta 1234
virtual machine linux con soluzione backend/frontend di proxy/caching verso il modello AI di LM Studio

Startup

Al momento per l0'esecuzione della soluzione, sulla virtual machine di proxy, vanno avviati backend (python) e frontend (node) manualmente.

Avvio soluzione:

backend

uvicorn main:app --host 0.0.0.0 --port 8000 --reload

frontend

npm run dev

ToDo's: trasformare in servizi da abilitare all'avvio macchina

Usage

Per utilizzare la soluzione basta andare (in ufficio o via vpn) all'indirizzo

https://chat.egalware.com

e da li fare domande all'AI.

Roadmap

Mancano molti punti di ottimizzazione:

gestione utenti locali (oauth? openID? user/pwd? username? IP?)
gestione sessioni indipendenti (setup REDIS da verificare) per gli utenti con history
miglioramento grafica
output performances
test modelli LLM più consistenti con scheda video + capace
completamento logiche RAG
fine tuning (o qualunque altra tecnica di post-addestramento) per aggiungere sorgenti private tra cui
- wiki aziendali
- documentazione
- codice sorgente (eventualmente da repo GIT con + versioni)

Versioni

Versione	Note	Data
0.1.2508.2019	Versione test solo locale con LM Studio	2025.08.20
0.1.2508.2119	Versione con esecuzione locale completa	2025.08.21
0.1.2508.2219	Versione completa e rivisitata graficamente x chat (con memoria sessioni)	2025.08.22
0.2.2509.0317	miglioramento gestione memoria sessioni	2025.09.03

Languages

JavaScript 61.1%

Python 31.7%

CSS 6.2%

HTML 0.7%

Shell 0.3%