Lọc Văn Bản
Trích xuất dữ liệu từ văn bản tức thì
Lọc Văn Bản giúp bạn trích xuất dữ liệu cụ thể từ bất kỳ đoạn văn bản nào – chỉ cần dán vào và chọn bộ lọc, kết quả hiện ra ngay, gọn gàng và không trùng lặp. Toàn bộ quá trình xử lý diễn ra ngay trong trình duyệt – văn bản của bạn không bao giờ rời khỏi thiết bị. Không đăng ký, không quảng cáo, không giới hạn, miễn phí mãi mãi.
Hữu ích cho người quản lý mạng xã hội cần thu thập hashtag, nhà tiếp thị trích xuất liên kết hoặc mã giảm giá từ nội dung chiến dịch, lập trình viên lấy URL hoặc mã định danh từ log, và bất kỳ ai cần tách dữ liệu cụ thể từ một đoạn văn bản – bao gồm kết quả Markdown từ các AI (ChatGPT, Claude, Gemini, Copilot), bài đăng mạng xã hội hay bất kỳ tài liệu nào.
Cách sử dụng
- Dán văn bản: Nhập hoặc dán văn bản vào ô trên – văn bản thuần túy, Markdown hoặc nội dung từ AI đều được.
- #Hashtags: Trích xuất tất cả các từ có tiền tố
#đứng độc lập – ví dụ#design,#MangXaHoi. Hỗ trợ đầy đủ Unicode: Latin, Arabic, Hán, Nhật, Hàn, Cyrillic và nhiều hơn nữa. Chỉ bắt hashtag thực sự độc lập; ký hiệu#trong tiêu đề hoặc định dạng khác sẽ bị bỏ qua. - Email: Trích xuất tất cả địa chỉ email hợp lệ trong văn bản – ví dụ
hello@example.com. Dấu câu dính cuối email (như dấu chấm hoặc phẩy cuối câu) được tự động loại bỏ. - Liên Kết: Trích xuất tất cả URL bắt đầu bằng
http://,https://hoặcwww., kể cả URL rút gọn không có scheme – ví dụbit.ly/eRy3lr,tinyurl.com/Av2Eic. Dấu câu dính cuối được tự động loại bỏ. - Số Liệu: Trích xuất các token số đứng độc lập – số nguyên, số thập phân, số âm, số có định dạng hàng nghìn và phần trăm – ví dụ
42,3.14,1.000.000,-99,30%. Chỉ bắt những con số hoàn toàn tách biệt. Chữ số nằm trong token hỗn hợp nhưORD-2026, chuỗi phiên bản nhưv1.2.3, hay số kèm đơn vị dính liền như100kghoặc50VNDsẽ không được trích xuất ở đây – chúng có thể xuất hiện trong kết quả Mã Số. - Mã Số: Trích xuất các token độc lập chứa cả chữ lẫn số – mã đơn hàng, mã giảm giá, số serial, chuỗi phiên bản, biển số xe, mã vận đơn – ví dụ
ORD-2026-AB12,SUMMER30,v1.2.3,69A-12345,100kg. Các ký tự nối phổ biến (-,_,.,@,/) được giữ nguyên trong token. Token phải bắt đầu và kết thúc bằng chữ hoặc số. Token chỉ có chữ hoặc chỉ có số sẽ bị loại. Hỗ trợ đầy đủ Unicode, kể cả chữ non-Latin kết hợp với số (ví dụHANGHOA123,주문2026). - Biểu Tượng: Trích xuất tất cả ký tự emoji trong văn bản – mặt cười, đồ vật, ký hiệu, cử chỉ tay và nhiều hơn nữa – ví dụ 😀, 🎉, ❤️, 🇻🇳, 👨💻. Xử lý chính xác các chuỗi phức tạp, bao gồm cờ quốc gia (🇯🇵), biến thể màu da (👍🏾) và chuỗi ZWJ (👨👩👧👦, 🧑🚀).
- Xếp Ngang / Xếp Dọc: Chuyển đổi giữa hiển thị kết quả trên một dòng (cách nhau bằng dấu cách) hoặc mỗi kết quả một dòng. Mặc định là xếp dọc. Có thể chuyển đổi bất cứ lúc nào mà không cần chạy lại bộ lọc.
- Sao Chép: Sao chép toàn bộ kết quả đang hiển thị vào bộ nhớ tạm, sẵn sàng dán ở bất kỳ đâu.
- Xóa: Xóa sạch cả ô nhập liệu và kết quả để bắt đầu phiên làm việc mới.
- Tùy chọn giao diện:
Cách hoạt động
Mỗi bộ lọc xử lý theo hai bước. Đầu tiên, định dạng Markdown được tự động loại bỏ khỏi văn bản đầu vào – in đậm, in nghiêng, tiêu đề, liên kết, khối code, bảng và các cú pháp khác đều được xóa, chỉ giữ lại văn bản thuần túy. Điều này đảm bảo kết quả chính xác dù bạn dán văn bản thô, Markdown từ AI hay nội dung sao chép từ bất kỳ nguồn nào. (Bộ lọc Biểu Tượng bỏ qua bước này vì emoji không bị ảnh hưởng bởi cú pháp Markdown.)
Tiếp theo, mỗi bộ lọc quét văn bản sạch và chỉ trích xuất các phần tử đứng độc lập – token xuất hiện riêng lẻ, không dính liền chữ, số hay ký tự nối khác. Điều này loại bỏ nhiễu: chữ số trong mã như ORD-2026 sẽ không xuất hiện trong kết quả Số Liệu, và một từ thông thường như hello sẽ không xuất hiện trong kết quả Mã Số. Kết quả trùng lặp được tự động loại bỏ trong khi vẫn giữ nguyên thứ tự xuất hiện đầu tiên. Toàn bộ xử lý diễn ra phía client – không gọi server, không thư viện ngoài, không AI.
Cài đặt như ứng dụng
Cài Lọc Văn Bản lên thiết bị để truy cập ngay từ màn hình chính. Hoạt động hoàn toàn ngoại tuyến sau lần tải đầu tiên.
- Android (Chrome): Menu → "Thêm vào màn hình chính" hoặc "Cài đặt ứng dụng".
- iPhone / iPad (Safari): Chia sẻ → "Thêm vào Màn hình chính".
- Máy tính (Chrome / Edge): Nhấn vào biểu tượng cài đặt trên thanh địa chỉ.
Quyền riêng tư & Bảo mật
- Xử lý 100% cục bộ: Toàn bộ quá trình lọc diễn ra trong trình duyệt của bạn. Văn bản không bao giờ được gửi lên server.
- Hoạt động ngoại tuyến: Sau lần tải đầu tiên, ứng dụng chạy hoàn toàn không cần kết nối internet.
- Không theo dõi: Chúng tôi dùng Cloudflare Web Analytics chỉ để thống kê lưu lượng ẩn danh. Không cookie, không quảng cáo, không thu thập thông tin cá nhân.
- Không đăng ký: Mở trang và dùng ngay, không cần tạo tài khoản.
Bằng việc sử dụng Lọc Văn Bản, bạn đồng ý với Quyền Riêng Tư và Điều Khoản.
Giới thiệu
- Lọc Văn Bản: locvanban.sonlt.app
- Email: contact@sonlt.app
- Được xây dựng bởi Lâm Thái Sơn
- Xây dựng trên nền tảng Text Filter