返回

Deno 1.0.0 傻瓜教程(3)

前端

Deno 1.0.0 现已发布,它为 Web 开发带来了激动人心的新功能。在本教程的第三部分中,我们将探讨使用 Deno 构建爬虫。

在开始之前,我们需要了解 Deno 的一些基础知识。Deno 是一种运行时环境,它允许你在没有 Node.js 或其他依赖项的情况下运行 JavaScript 代码。这使得它成为构建轻量级和可移植应用程序的理想选择。

使用第三方库

Deno 目前对第三方库的支持有限,因此我们需要使用额外的库,例如 jspm,来引入第三方库。以下是如何使用 jspm 安装 cheerio 库:

deno install -A https://deno.land/x/jspm@0.19.99/jspm
jspm install cheerio

获取网页 DOM

要获取网页的 DOM,我们可以使用 Deno 的 fetch 函数。该函数返回一个 Response 对象,其中包含页面的 HTML。以下是获取 Google 主页 DOM 的示例:

import { fetch } from "https://deno.land/std@0.142.0/http/server.ts";

const response = await fetch("https://google.com");
const html = await response.text();

使用 Cheerio

Cheerio 是一个类似于 jQuery 的库,它允许我们通过选择器来选择 DOM 元素。以下是使用 Cheerio 从 Google 主页中提取标题的示例:

import cheerio from "https://deno.land/x/cheerio@1.0.0/mod.ts";

const $ = cheerio.load(html);
const title = $("title").text();

完整示例

以下是一个完整的示例,演示如何使用 Deno 和 Cheerio 构建一个简单的爬虫:

import { fetch } from "https://deno.land/std@0.142.0/http/server.ts";
import cheerio from "https://deno.land/x/cheerio@1.0.0/mod.ts";

const url = "https://google.com";

const response = await fetch(url);
const html = await response.text();

const $ = cheerio.load(html);
const title = $("title").text();

console.log(`页面的标题为:${title}`);

总结

在本教程中,我们探讨了如何使用 Deno 构建一个简单的爬虫。我们了解了如何使用第三方库,获取网页 DOM,并使用 Cheerio 解析 DOM。这些技术为构建各种各样的 Web 应用程序提供了强大的基础。