安装
要安装Firecrawl Node SDK,您可以使用npm:Node
使用方法
- 从firecrawl.dev获取API密钥
- 将API密钥设置为名为
FIRECRAWL_API_KEY的环境变量,或者将其作为参数传递给FirecrawlApp类。
Node
抓取单个URL
要使用错误处理抓取单个URL,请使用scrapeUrl方法。它接受URL作为参数,并以字典形式返回抓取的数据。
Node
爬取网站
要使用错误处理爬取网站,请使用crawlUrl方法。它接受起始URL和可选参数作为参数。params参数允许您为爬取任务指定其他选项,例如要爬取的最大页面数、允许的域名和输出格式。
Node
异步爬取
要异步爬取网站,请使用crawlUrlAsync方法。它返回爬取ID,您可以使用该ID检查爬取任务的状态。它接受起始URL和可选参数作为参数。params参数允许您为爬取任务指定其他选项,例如要爬取的最大页面数、允许的域名和输出格式。
Node
检查爬取状态
要使用错误处理检查爬取任务的状态,请使用checkCrawlStatus方法。它接受ID作为参数,并返回爬取任务的当前状态。
Node
取消爬取
要取消异步爬取任务,请使用cancelCrawl方法。它接受异步爬取的任务ID作为参数,并返回取消状态。
Node
映射网站
要使用错误处理映射网站,请使用mapUrl方法。它接受起始URL作为参数,并以字典形式返回映射数据。
Node
使用WebSockets爬取网站
要使用WebSockets爬取网站,请使用crawlUrlAndWatch方法。它接受起始URL和可选参数作为参数。params参数允许您为爬取任务指定其他选项,例如要爬取的最大页面数、允许的域名和输出格式。
Node
错误处理
SDK处理Firecrawl API返回的错误并引发适当的异常。如果在请求期间发生错误,将引发带有描述性错误消息的异常。上面的示例演示了如何使用try/catch块处理这些错误。