Ra lệnh cho trợ lý agent bằng lời nói với dictation
Một vài use case mình đang dùng Hermes Agent như trợ lý tự động trong công việc hằng ngày — đặc biệt là qua ra lệnh Telegram với tính năng voice dictation.
Trợ lý = Thư ký thân cận
Lâu lâu có người nhắn hỏi mình dùng Hermes Agent để làm những việc gì?
Xem trong các group thì thấy mọi người share khá nhiều use case: Tạo báo giá, nghiên cứu, trading, coding làm web, viết nội dung... Nhưng cũng không ít người mày mò một thời gian rồi thấy không khác gì lắm mấy tool nhắc lịch, tổng hợp tin tức khác mà lại bị tốn token.
Tất nhiên nếu chỉ mở một cửa sổ chat lên hỏi đáp thì agent đúng là không khác chatbot bao nhiêu. Khác biệt chỉ thể hiện khi: 1) Thiết lập Hermes các công cụ và quyền truy cập vào các thông tin của bạn : Vd như Google Drive, Calendar, Email, Facebook, Twitter, Github v.v.. và 2) Giao mục tiêu (thay vì nhiệm vụ) để Hermes tự đưa ra kế hoạch và thực hiện.
Tất nhiên phải có những guardrail phù hợp để chắc chắn Hermes không vô tình thay đổi hoặc thực hiện các hành động ngoài ý muốn.
Voice dictation
Mình dùng nhiều và cũng rất tâm đắc với tính năng voice dictation (chuyển lời nói qua mic thành văn bản), thực hiện thông qua Telegram.
Thay vì gõ thi mình chỉ nói yêu cầu một mạch vào điện thoại. Câu chữ ban đầu có thể lộn xộn, sai chính tả, sai tên công cụ, có đoạn còn khó hiểu vì dictation nhận nhầm. Nhưng Hermes sau đó vẫn có thể sửa lại chỗ sai, nắm rõ ý yêu cầu, rồi thực hiện.
Cái hay là đỡ phải bấm điện thoại mệt + agent đánh giá và đưa ra kết hoạch thực hiện dựa trên các công cụ có sẵn. Có khi mình nói về một mục tiêu muốn theo đuổi vài tuần, nó chia nhỏ ra thành các bước rồi đặt lịch nhắc định kỳ. Những việc chỉ ghi vào note thì rất dễ chìm, nhưng có một agent thỉnh thoảng quay lại nhắc và rà soát tiến độ thì khá là tiện.
Có khi đó lại là một ý tưởng hay một kinh nghiệm nhỏ sau khi xử lý xong việc gì đó, mình nhờ Hermes lưu vào personal brain. Cái này thì mình dùng khá nhiều, nhất là để viết nhật ký: hôm nay gặp vấn đề gì, xử lý ra sao, cách nào hiệu quả, bài học là gì. Personal brain này có thể được tham khảo bởi Hermes hoặc mình hỏi lại sau này.
Có khi mình nói về một ý tưởng bài viết trong vài phút, nó gom lại thành bố cục, research thêm, rồi viết thành bài nháp trên Substack. Mình nói ý chính bằng giọng, agent sắp xếp lại cho mạch lạc hơn, rồi mình đọc lại và chỉnh tiếp khi back lại máy tính.
Có khi mình nhờ nó lướt MXH hộ để tìm kiếm và tổng hợp thông tin cần. Vì agent chạy trên máy cá nhân, nơi mình đã đăng nhập sẵn một số dịch vụ, nên nó có thể mở trình duyệt thao tác trong phạm vi mình cho phép: tạo bản nháp Substack, đọc vài trang, lướt Facebook hay X, xem bài của bạn bè, chuẩn bị nội dung đăng. Những thao tác công khai như đăng bài, chia sẻ, bình luận thì mình vẫn muốn có bước xác nhận cuối cùng, nhưng phần đọc và tổng hợp, viết comment nháp thì nó làm thay khá tiện.
Hơi bất tiện nếu dùng dictation ở chỗ đông người. Không sao, kê sát miệng vào mic nói nhỏ vẫn nhận được tốt, đã thử và ok.
Mình ko dùng Hermes cho công việc liên quan coding do cũng đã dùng Claude và Codex, các tác vụ agentic thì 2 app đó cũng đã xử lý quá ổn áp rồi.
Happy vibe commanding!




