收藏
返校日-走进多模态大模型“眸思”及其公益应用“听见世界”

发起:复旦大学校友总会

组织:复旦大学计算机科学技术学院

时间: 2024-05-25 14:00:00.0 ~ 2024-05-25 15:30:00.0

地点:复旦大学邯郸校区逸夫楼601教室

人数:60(已有58人参加)

活动参与人 查看所有报名人(58)
详情介绍

活动简介】2024年5月25日校友返校日下午,复旦大学计算机科学技术学院邀请返校校友参加多模态大模型“眸思”及其公益应用“听见世界”讲座。

活动安排

时间:2024年5月25日(周六)14:00-15:30

地点:复旦大学邯郸校区逸夫楼601教室

主讲人:复旦大学自然语言处理实验室博士后纪焘,博士生江常皓

活动介绍

      2022年11月ChatGPT发布以来,大模型成为人工智能领域最前沿的技术。复旦NLP团队在2023年2月发布国内第一个对话式大型语言模型MOSS,紧跟国际前沿技术。2024年1月,复旦大学语言与视觉团队联合提出的视觉-语言多模态大模型“眸思”,“眸”代表着视觉能力,“思”则表示语言思维能力。眸思将擅长图文匹配、光学字符识别(OCR)和图像分割等多种经典视觉任务的专家巧妙地融为一体,显著提高了多模态大模型在多模态对话中处理传统视觉任务的表现效果。本次活动的第一部分将会介绍多模态大模型的相关技术与“眸思”的研究经历,并进行应用演示。

图1.png

微信图片_20240514104732.png

在中国,视障者的数量高达1700万,这意味着每100人中就有1位视力受限的朋友。视障者日常生活中的需求很多,出行需求是主要痛点。基于眸思多模态大模型,复旦NLP团队开启“听见世界”项目,在2024年2月推出第一版视障人士专用的多模态大模型,听见世界APP能为视障人士提供街道行走、自由问答、物品寻找、拍照朗读等功能。该项目依托多模态大模型等高精尖AI技术,仅需较低成本就能极大改善视障人士的生活现状,服务广大视障群体。本次活动的第二部分将会介绍听见世界项目,并进行应用演示。

微信图片_20240514104828.png

 

展开活动详情展开
活动掠影
暂无活动掠影
讨论交流
讨论加载中...
赶快报名来和校友一起讨论吧