Lọc Văn Bản
Trích Xuất Dữ Liệu Từ Bất Kỳ Văn Bản Nào
Lọc Văn Bản giúp bạn trích xuất dữ liệu cụ thể từ bất kỳ văn bản nào – chỉ cần dán vào và chọn bộ lọc, kết quả hiện ra ngay, gọn gàng và không trùng lặp. Hỗ trợ mọi ngôn ngữ và bộ ký tự Unicode. Toàn bộ xử lý diễn ra ngay trên trình duyệt của bạn – dữ liệu không bao giờ rời khỏi thiết bị. Không cần đăng ký, không quảng cáo, không giới hạn, miễn phí mãi mãi.
Hữu ích cho người quản lý mạng xã hội cần thu thập hashtag, nhà tiếp thị trích xuất mã giảm giá từ nội dung chiến dịch, lập trình viên lấy URL hoặc mã định danh từ log, và bất kỳ ai cần kiểm tra số liệu hay liên kết trong tài liệu trước khi đăng. Khác với các công cụ AI, Lọc Văn Bản xử lý hoàn toàn xác định – không ảo giác, không giới hạn độ dài, không cần internet.
Cách Sử Dụng
- Dán văn bản: Nhập hoặc dán bất kỳ văn bản nào vào ô nhập liệu phía trên – văn bản thuần túy, Markdown, HTML, văn bản sao chép từ trang web, nội dung do AI tạo ra (ChatGPT, Claude, Gemini), bài đăng mạng xã hội, log, tài liệu và nhiều định dạng khác. Mọi định dạng đều hoạt động.
- #Hashtags: Trích xuất tất cả các từ độc lập bắt đầu bằng
#– ví dụ#thiếtkế,#MạngXãHội. Hỗ trợ đầy đủ Unicode: Latin, Ả Rập, Trung, Nhật, Hàn, Cyrillic và nhiều ngôn ngữ khác. Chỉ bắt hashtag đứng độc lập; ký hiệu#trong tiêu đề hoặc các định dạng khác sẽ bị bỏ qua. - Email: Trích xuất tất cả địa chỉ email hợp lệ trong văn bản – ví dụ
contact@sonlt.app. Dấu câu ở cuối địa chỉ email (như dấu chấm hoặc dấu phẩy cuối câu) sẽ được tự động loại bỏ khỏi kết quả. - Liên Kết: Trích xuất tất cả URL bắt đầu bằng
http://,https://hoặcwww., cũng như URL rút gọn không có scheme – ví dụbit.ly/69tS1r,tinyurl.com/12V3Qi. Dấu câu ở cuối URL sẽ được tự động loại bỏ khỏi kết quả. - Số Liệu: Trích xuất các token số độc lập – số nguyên, số thập phân, số âm, số có định dạng hàng nghìn, phần trăm và dải số nối bằng dấu gạch – ví dụ
42,3.14,1.000.000,-99,30%,123-789,2025–2030. Mọi dấu gạch Unicode (gạch ngang, gạch ngang ngắn, gạch ngang dài và các dạng khác) đều được nhận dạng là dấu phân cách dải số khi cả hai bên đều là chữ số. Các cụm số thuần chỉ cách nhau đúng một dấu cách được gom thành một kết quả – ví dụ0888 666 999và1234 5678 9012 3456mỗi cái xuất hiện là một dòng kết quả, giúp trích xuất số điện thoại và số tài khoản ngân hàng định dạng bằng dấu cách dễ dàng hơn. Chữ số trong mã hỗn hợp nhưORD-2026, chuỗi phiên bản nhưv1.2.3, hoặc số lượng có đơn vị dính liền như100kghay50USDsẽ không được trích xuất bởi Số Liệu – chúng có thể xuất hiện trong kết quả Mã Số. - Mã Số: Trích xuất các token độc lập chứa cả chữ lẫn số – mã đơn hàng, mã giảm giá, số serial, chuỗi phiên bản, biển số xe và số tracking – ví dụ
ORD-2026-AB12,ORD–2026–AB12,SUMMER30,v1.2.3,69A-12345,100kg. Mọi dấu gạch Unicode (gạch ngang, gạch ngang ngắn, gạch ngang dài và các dạng khác) cũng như_,.,@,/đều được nhận dạng là ký tự nối trong token – đảm bảo bắt đúng mã được xuất từ Word, PDF hoặc ERP dùng dấu gạch kiểu chữ in. Token phải bắt đầu và kết thúc bằng chữ cái hoặc chữ số. Token chỉ chứa chữ số hoặc chỉ chứa chữ cái sẽ bị loại trừ. Hỗ trợ đầy đủ Unicode, bao gồm cả bảng chữ cái không phải Latin kết hợp với chữ số (ví dụ商品A123,주문2026). - Biểu Tượng: Trích xuất tất cả ký tự emoji trong văn bản – mặt cười, đồ vật, biểu tượng, cử chỉ tay và nhiều loại khác – ví dụ 😀, 🎉, ❤️, 🇻🇳, 👨💻. Xử lý đúng các chuỗi phức tạp, bao gồm cờ quốc gia (🇯🇵), biến thể màu da (👍🏻) và tổ hợp ZWJ (👨👩👧👦, 🧑🚀).
- Xếp Ngang / Xếp Dọc: Chuyển đổi giữa hiển thị kết quả trên một dòng (cách nhau bằng dấu cách) hoặc mỗi kết quả một dòng. Mặc định là xếp dọc. Có thể chuyển đổi bất cứ lúc nào mà không cần chạy lại bộ lọc.
- Sao Chép: Sao chép toàn bộ kết quả đang hiển thị vào bộ nhớ tạm, sẵn sàng dán ở bất kỳ đâu.
- Xóa: Xóa sạch cả ô nhập liệu và kết quả để bắt đầu phiên làm việc mới.
- Tùy chọn giao diện:
Cách Hoạt Động
Lọc Văn Bản hoạt động với mọi định dạng văn bản – không cần dọn dẹp trước khi dán. Dù văn bản của bạn là thuần túy, bọc trong cú pháp Markdown, nhúng trong HTML, hay sao chép từ phản hồi AI, trang web hoặc tài liệu, mỗi bộ lọc chỉ trích xuất đúng thứ bạn cần và bỏ qua tất cả phần còn lại. Kết quả trùng lặp được tự động loại bỏ trong khi vẫn giữ nguyên thứ tự xuất hiện đầu tiên.
Mỗi bộ lọc chỉ nhắm vào các phần tử đứng độc lập – token xuất hiện riêng lẻ, không dính liền chữ, số hay ký tự nối khác. Điều này loại bỏ nhiễu: chữ số trong mã như ORD-2026 sẽ không xuất hiện trong kết quả Số Liệu, và một từ thông thường như contact sẽ không xuất hiện trong kết quả Mã Số. Toàn bộ xử lý diễn ra phía client – không gọi server, không thư viện ngoài, không AI.
Cài Đặt Như Ứng Dụng
Cài Lọc Văn Bản lên thiết bị để truy cập ngay từ màn hình chính. Hoạt động hoàn toàn ngoại tuyến sau lần tải đầu tiên.
- Android (Chrome): Menu → "Thêm vào màn hình chính" hoặc "Cài đặt ứng dụng".
- iPhone/iPad (Safari): Chia sẻ → "Thêm vào Màn hình chính".
- Máy tính (Chrome/Edge): Nhấn vào biểu tượng cài đặt trên thanh địa chỉ.
Quyền Riêng Tư và Bảo Mật
- Xử lý 100% cục bộ: Toàn bộ quá trình lọc diễn ra trong trình duyệt của bạn. Văn bản không bao giờ được gửi lên server.
- Hoạt động ngoại tuyến: Sau lần tải đầu tiên, ứng dụng chạy hoàn toàn không cần kết nối internet.
- Không theo dõi: Chúng tôi dùng Cloudflare Web Analytics chỉ để thống kê lưu lượng ẩn danh. Không cookie, không quảng cáo, không thu thập thông tin cá nhân.
- Không đăng ký: Mở trang và dùng ngay, không cần tạo tài khoản.
Bằng việc sử dụng Lọc Văn Bản, bạn đồng ý với Quyền Riêng Tư và Điều Khoản.
Giới Thiệu
- Lọc Văn Bản: locvanban.sonlt.app
- Email: contact@sonlt.app
- Được xây dựng bởi Lâm Thái Sơn
- Xây dựng trên nền tảng Text Filter