“`markdown
🎯 Mục Đích
Mục tiêu chính của workflow này là thu thập và xử lý thông tin từ các nguồn dữ liệu trực tuyến như TechCrunch và VentureBeat, nhằm tạo ra các báo cáo và phân tích nội dung cho các bài viết từ những nguồn này, đồng thời lưu trữ dữ liệu vào Airtable.
⚙️ Cách Thức Hoạt Động
Kích hoạt workflow qua nút ‘Test workflow’ (manualTrigger).
Lọc dữ liệu với node filter để xác định điều kiện tiến hành tiếp.
Phân tích thông tin đầu ra bằng outputParserStructured để chuẩn hóa dữ liệu.
Truyền đạt qua OpenRouter với lmChatOpenRouter để có phản hồi từ mô hình AI.
Lọc lại thông tin với filter để chỉ giữ lại những dữ liệu cần thiết.
Trích xuất dữ liệu có cấu trúc bằng informationExtractor.
Nghiên cứu URL và trích xuất URL thông qua chainLlm.
Ghép dữ liệu đã trích xuất từ nhiều nguồn lại với nhau bằng merge.
Phân tách các bài viết từ TechCrunch và VentureBeat để xử lý riêng biệt bằng splitOut.
Phân tích HTML từ các bài viết với TC HTML Parser và VB HTML Parser.
Thực hiện yêu cầu HTTP để lấy dữ liệu từ TechCrunch và VentureBeat.
Sử dụng Claude 3.5 để tạo ra nội dung sáng tạo (sonnet và haiku).
Lưu trữ dữ liệu vào Airtable nhằm lưu trữ và tổ chức thông tin một cách hiệu quả.
Trích xuất và định dạng JSON chuẩn hóa và sửa lỗi đầu ra nếu cần thiết.
Gọi thêm dữ liệu nghiên cứu sâu từ dịch vụ HTTP khác và thực hiện tìm kiếm sâu bằng JINA.
Ghi kết quả vào Airtable để quản lý dữ liệu lâu dài.
🔗 Tích Hợp Quan Trọng
manualTrigger: Kích hoạt quy trình một cách thủ công.
filter: Giới hạn luồng dữ liệu dựa trên điều kiện.
outputParserStructured: Phân tích và chuẩn hóa dữ liệu đầu ra.
lmChatOpenRouter: Kết nối để nhận phản hồi từ AI.
Airtable: Lưu trữ và quản lý dữ liệu.
💼 Giá Trị Kinh Doanh
Workflow giải quyết vấn đề thu thập, phân tích và tổ chức thông tin từ các nguồn tin tức hàng đầu, giúp người dùng tiết kiệm thời gian và nâng cao độ chính xác trong việc lấy thông tin và triển khai báo cáo. Điều này đặc biệt hữu ích cho các nhà nghiên cứu, nhà báo, hoặc bất kỳ ai cần theo dõi thông tin thị trường.
📊 Đánh Giá Kỹ Thuật
Độ phức tạp của workflow cao do sử dụng nhiều node và kết nối. Để nâng cao khả năng bảo trì, có thể chia nhỏ workflow thành các workflow con và sử dụng các node tái sử dụng. Ngoài ra, xem xét việc tự động hóa các phần có thể giảm thiểu thao tác thủ công.
🏷️ Thẻ
Data Processing
Automation
Web Scraping
AI Integration
Airtable
“`