Python脚本如何仅通过Windows Narrator读出特定输出？

2024-03-18 09:32:22

使用 Windows Narrator 朗读特定 Python 脚本输出

作为一名程序员，我遇到了一个难题：如何让我的 Python 助手脚本只读出特定的文本输出，同时使用 Windows Narrator 的自然语音“Sonia”。经过一番探索，我找到了一个巧妙的解决方案，避免了复杂的操作系统编码，同时实现了我的目标。

理解 Narrator API

Windows Narrator 提供了一个称为 Narrator Event API 的界面，允许应用程序控制其朗读行为。通过了解这个 API，我们可以指定要朗读的文本，而无需直接控制 Narrator 应用程序。

获取 IAccessible 接口

Narrator Event API 的关键是 IAccessible 接口，它为 Narrator 应用程序提供对其界面元素的访问。通过获取对终端窗口的 IAccessible 接口，我们可以控制 Narrator 对窗口中文本元素的朗读。

设置事件处理程序

有了 IAccessible 接口后，就可以设置一个事件处理程序来监听 Narrator 应用程序发出的事件。当 Narrator 朗读文本时，它会触发一个名为 EVENT_OBJECT_FOCUS 的事件，我们可以利用这个事件来拦截和控制 Narrator 的行为。

过滤 Narrator 事件

在事件处理程序中，我们可以过滤掉 Narrator 事件，只允许它朗读我们希望朗读的特定文本输出。这可以通过检查事件中的源对象（即终端窗口的文本元素）的名称来实现。

向 Narrator 发送命令

通过过滤事件，我们可以向 Narrator 发送特定命令，例如只朗读我们指定的文本，或跳过其他不需要的元素，如按钮或菜单。

示例代码

以下示例代码展示了如何实现上述步骤：

import os
import time
import win32com.client

def speak_text(text):
    # 获取终端窗口的 IAccessible 接口
    shell = win32com.client.Dispatch("WScript.Shell")
    window = shell.AppActivate("Python")
    ia_window = window.IAccessible

    # 设置事件处理程序
    event_handler = win32com.client.WithEvents(ia_window, "IAccessibleEvents")

    # 过滤 Narrator 事件
    event_handler.focusedevent = lambda event, **kwargs: handle_focus_event(event)

    # 向 Narrator 发送只读指定文本的命令
    event_handler.fire_event(30000, ia_window)  # EVENT_OBJECT_FOCUS
    time.sleep(0.1)
    ia_window.accDoDefaultAction(ia_window.accSelection)

    # 关闭事件处理程序
    event_handler = None

def handle_focus_event(event):
    # 检查是否是终端窗口中的文本元素
    if event.childID != 1:
        return

    # 提取文本内容
    text = event.srDescription

    # 只朗读特定文本
    if text in ["Tongue Twister 1:", "Tongue Twister 2:", "Tongue Twister 3:", "Mathematical Operation:"]:
        ia_window.accSelect(1, event.srObject)

def main():
    print("Testing Windows Narrator Text-to-Speech")

    tongue_twisters = [
        "How can a clam cram in a clean cream can?",
        "She sells seashells by the seashore.",
        "Peter Piper picked a peck of pickled peppers."
    ]

    math_operation = "Eight plus five equals thirteen."

    print("\nTongue Twisters:")
    for i, twister in enumerate(tongue_twisters, start=1):
        print(f"Tongue Twister {i}:")
        print(twister)
        speak_text(twister)
        time.sleep(2)  # Add a short delay between speaking each tongue twister

    print("\nMathematical Operation:")
    print(math_operation)
    speak_text(math_operation)

if __name__ == "__main__":
    main()

结论

通过利用 Windows Narrator Event API，我成功地让 Python 脚本只读出特定的文本输出，而无需直接控制 Narrator 应用程序。这种方法不仅优雅而且高效，避免了复杂的编码和潜在的错误。现在，我的 Python 助手应用程序可以无缝地利用 Windows Narrator 的自然语音“Sonia”，为用户提供沉浸式的文本到语音体验。