Deno 1.0.0 傻瓜教程（3）

2024-02-25 03:55:48

Deno 1.0.0 现已发布，它为 Web 开发带来了激动人心的新功能。在本教程的第三部分中，我们将探讨使用 Deno 构建爬虫。

在开始之前，我们需要了解 Deno 的一些基础知识。Deno 是一种运行时环境，它允许你在没有 Node.js 或其他依赖项的情况下运行 JavaScript 代码。这使得它成为构建轻量级和可移植应用程序的理想选择。

使用第三方库

Deno 目前对第三方库的支持有限，因此我们需要使用额外的库，例如 jspm，来引入第三方库。以下是如何使用 jspm 安装 cheerio 库：

deno install -A https://deno.land/x/jspm@0.19.99/jspm
jspm install cheerio

获取网页 DOM

要获取网页的 DOM，我们可以使用 Deno 的 fetch 函数。该函数返回一个 Response 对象，其中包含页面的 HTML。以下是获取 Google 主页 DOM 的示例：

import { fetch } from "https://deno.land/std@0.142.0/http/server.ts";

const response = await fetch("https://google.com");
const html = await response.text();

使用 Cheerio

Cheerio 是一个类似于 jQuery 的库，它允许我们通过选择器来选择 DOM 元素。以下是使用 Cheerio 从 Google 主页中提取标题的示例：

import cheerio from "https://deno.land/x/cheerio@1.0.0/mod.ts";

const $ = cheerio.load(html);
const title = $("title").text();

完整示例

以下是一个完整的示例，演示如何使用 Deno 和 Cheerio 构建一个简单的爬虫：

import { fetch } from "https://deno.land/std@0.142.0/http/server.ts";
import cheerio from "https://deno.land/x/cheerio@1.0.0/mod.ts";

const url = "https://google.com";

const response = await fetch(url);
const html = await response.text();

const $ = cheerio.load(html);
const title = $("title").text();

console.log(`页面的标题为：${title}`);