점검 중
⚙️ 설정
🌐 인터넷 검색 필요할 때 웹에서 최신 정보를 찾아요
💬 대화 기억하기 7일 동안 기억해요
📄 참고 문서 보기 답변에 사용된 문서를 표시해요
🌡️ 창의성 높을수록 더 자유롭게 대답해요
1.0
🎯 정확하게 🎨 자유롭게
ℹ️ 시스템 구성
On-A-I 시스템 아키텍처 🌐 ONLINE Tavily API 웹검색 DuckDuckGo Fallback Online ChromaDB 원본 벡터 DB 인터넷 연결 시 주기적 복사 → 🖥️ BROWSER (Client) Browser (Chrome/Edge) HTML + JavaScript Cookie: session_id (7d) 🖥️ LOCAL GPU SERVER (On-Device) Nginx 1.28.2 Reverse Proxy SSL/TLS · Gzip :443 → :8083 FastAPI Backend Python 3.12 · uvicorn Keyword Filter System Prompt Builder port 8083 RAG Pipeline Local ChromaDB Vector DB (로컬) cosine similarity dist ≤ 0.55 filter Embedding KURE-v1 Sentence Transformer nlpai-lab/KURE-v1 Re-ranker bge-reranker-v2-m3-ko Cross-Encoder Top-3 재정렬 LLM · google_gemma-3-27b-it-IQ4_XS.gguf llama.cpp · Q4_K_M GGUF · n_ctx 32768 n_gpu_layers=-1 (Full GPU Offload) RTX GPU · CUDA · shm 64GB Redis 7.4 Session Store TTL: 7d port 6379 웹검색 결과 HTTPS 쿼리 Top-N Top-3 세션 히스토리 답변 📵 오프라인 시 웹검색 불가 📋 Tech Stack & Specs 🤖 LLM google_gemma-3-27b-it-IQ4_XS.gguf · Q4_K_M GGUF (4-bit) · n_ctx 32,768 · Full GPU Offload · repeat_penalty 1.1 📐 Embed KURE-v1 (nlpai-lab) · dim 1024 · max_seq 8,192 tokens · BGE-M3 기반 · 한국어 200만 쌍 학습 🔁 Rerank bge-reranker-v2-m3-ko (dragonkue) · XLM-RoBERTa-Large · max_seq 1024 tokens · 2.2GB · BGE-M3 한국어 파인튜닝 🔮 Vector ChromaDB 1.5.1 · HNSW cosine · ef_construction 200 · M=16 · threshold 0.55 · chunk 800자 / overlap 80자 ⚡ Session Redis 7.4 Alpine · JSON serialize · TTL 7d · MAX_HISTORY_TOKENS 4,096 🌐 Search Tavily API (primary) · AI 기반 콘텐츠 추출 · 월 1,000회 → DuckDuckGo (fallback) · max_results=3 🖥️ Infra Nginx 1.28.2 · SSL/TLS · proxy_buffering off · gzip off (SSE) · Docker · shm 64GB 🔄 Sync Online ChromaDB → Local 주기적 동기화 · 오프라인 시 Local DB 단독 운용 · 웹검색 자동 비활성화 🎮 GPU NVIDIA RTX 5070 Ti · VRAM 16GB · CUDA · Full GPU Offload · n_gpu_layers=-1
🌟

On-A·i

안녕하세요! 저는 온아이예요 🧒🏻🧒🏻

On-A-I · 우리 가족 전용 AI 어시스턴트
온아이는 우리 가족만을 위해 특별히 설계된 전용 AI 어시스턴트로, 일반적인 AI와 달리 우리 가족의 생활 방식, 관심사, 개인적인 맥락을 반영하여 더욱 깊이 있고 개인화된 대화를 제공해요.
연준이와 연재의 눈높이에 맞춰 어려운 전문 용어나 복잡한 표현 대신 쉽고 친근한 언어로 대화하며, 학습과 일상의 궁금증을 부담 없이 편하게 해결할 수 있도록 항상 곁에서 도와드려요.
함께한 여행, 소중한 추억, 가족의 이야기들을 기억하고 있어서 단순한 정보 검색을 넘어 우리 가족만의 경험과 추억을 바탕으로 더 가깝고 풍부하며 의미 있는 대화가 가능해요.
온 가족이 언제나 편안하고 안전하게 이용할 수 있도록 유해하거나 부적절한 콘텐츠는 자동으로 차단되며, 아이들이 사용하기에 적합한 환경을 유지하도록 세심하게 설계되었어요.
📚 공부 도와줘
📞 아빠 전화번호 뭐야?
🌍 지구는 왜 둥글어?