LLM Gateway 2026: đừng gọi model trực tiếp nữa, hãy route như một hệ thống production
Có một lỗi kiến trúc khá phổ biến khi team mới đưa AI vào sản phẩm: code app gọi thẳng OpenAI/Anthropic/Gemini/whatever bằng SDK, hardcode model trong service, rồi hy vọng mọi thứ ổn.
Demo t