Skip to content

物联网协会自然语言处理组

作者:自然语言处理小组🖊️

1.成员:

  • 负责人👾 :吴雨凝
  • 小组成员👾 :喻彦蓉

2.自然语言处理介绍:

2.1 什么是自然语言处理:

  • 自然语言👻:

    • 语言理解:通过分析文本或语音,理解自然语言的含义、语法结构、语义关系等。任务包括命名实体识别、词性标注、句法分析、语义角色标注等。
    • 语言生成:根据一定的规则或模型,生成符合语言规范和上下文的自然语言文本。任务包括机器翻译、文本摘要、对话系统的回复生成等。
    • 语言模型:利用统计和机器学习方法,对语言的概率分布进行建模,用于识别语言中的规律和模式。任务包括语音识别、词语预测、句子生成等。
  • 简单理解🤔:

    • 也就是帮助计算机理解自然语言的含义、语法、语义等方面,并能够进行相应的处理和分析。
  • image.png

2.2 物联网协会的自然语言处理组都做什么:

  • 语音识别🐱:

    • 它是自然语言处理(NLP)的一个重要方向,通过计算机系统将语音信号转换为文本或命令。旨在让计算机能够理解和处理人类的语音输入。
      • 常用语音识别框架Wenet(原名ESPnet)是一个开源的语音处理工具包,它提供了丰富的工具和模型用于语音识别和语音生成任务。Wenet是以PyTorch为基础构建的,具有灵活性和高度可扩展性。
  • TTS🐒:

    • TTS技术旨在将文本转换为语音,将输入的文本信息转化为自然、流畅的语音输出。
    • Tacotron和Tacotron 2以及WaveNet可以使用PyTorch来实现Tacotron和Tacotron 2模型,通过搭建相应的网络结构和训练逻辑进行开发。
  • 对话系统🦁:

    • 是一种能够与人类进行自然语言对话的系统。它模拟人类的对话能力,能够理解用户的输入,并回复相应的内容,实现人机之间的交流和互动。
    • GPT(Generative Pre-trained Transformer)系列就是其中的代表:这是由OpenAI提出的基于Transformer架构的大规模预训练模型。包括GPT、GPT-2、GPT-3等,这些模型在海量数据上进行预训练,然后可以用于生成文本、回答问题等任务。
  • Linux💻

    • Linux是一个强大、灵活、免费的操作系统,被广泛用于各种领域,从个人电脑到服务器和嵌入式系统。它的开放性和多样性使其成为计算领域中的一个重要力量,也为用户提供了广泛的选择和控制权。
    • 部署的许多服务都需要放到服务器上,而服务器一般而言都是采用Linux系统,所以学习Linux指令非常有必要。
    • 学习Linux命令可以增加对计算机底层运行的了解,以及对操作系统和计算机体系结构的理解。

3.开发环境:

  • Pycharm🐱:
    • PyCharm是一个强大且广泛使用的Python开发工具,适用于各种Python项目,从简单的脚本到大规模的Web应用程序和数据科学项目。它提供了一套完整的工具,可帮助Python开发人员提高生产力并更轻松地开发高质量的Python代码。
  • CLion🐈:
    • CLion是一个面向C和C++开发人员的高效工具,旨在提高他们的工作效率和代码质量。它提供了一套全面的工具,帮助开发人员编写、调试和管理复杂的C/C++项目,并且适用于各种应用领域,包括系统编程、嵌入式开发、游戏开发和科学计算等。
  • Ubuntu22.04🐎:
    • 算法开发与部署必不可少的Linux系统,算法组开发都基于Ubuntu22.04。

4.开发语言:

  • Python/AscendCL/C++

Last updated:

Released under the MIT License.