首页 >资讯 > 正文

澜舟科技周明:大模型创业,也可以小而美 世界今亮点

2023-05-19 09:16:07

“我知道(大模型)未来一定会兴起,要早一点做准备,否则就来不及了。”

文 |《中国企业家》记者 孔月昕

编辑 |马吉英


(资料图片仅供参考)

图片来源 |受访者

大模型是未来,周明对此早有预判。

创业之前,澜舟科技创始人兼CEO周明在微软亚洲研究院已经领导团队做了3年多的大模型。“微软跟OpenAI有合作,我们团队也跟他们有一些接触,拿他们的GPT-2做一些实验。”

2020年,周明辞去了微软亚洲研究院副院长的职位,离开了工作21年的微软,准备创业。 “我知道(大模型)未来一定会兴起,要早一点做准备,否则就来不及了。”

这个决定并没有获得所有人的认同,有人劝周明,“你折腾这干什么?”很多朋友也被他的坚持所打动,选择“能帮就帮一下”。“要不看起来我苦哈哈的。”周明笑称。

有了创业的打算后,周明第一时间找到了李开复。1999年,李开复把周明从清华招聘到微软亚洲研究院。 李开复对周明的创业想法表示大力支持。 他首先聘请周明加入创新工场担任首席科学家,熟悉创业环境,一点点开始孵化一个NLP(自然语言处理)团队。“开复给我提供了很多帮助,包括团队方向、找人和融资等方面都给予了大力帮助。我们创业到今天还算走得顺利,在很多关键节点上开复和创新工场都给予了支持。”

2021年6月,周明创办了澜舟科技,沿着AI的NLP方向创业。他领导团队研发的“孟子预训练模型”,打造了搜索、生成、翻译、对话等一系列功能引擎和垂直场景应用。

2021年,“孟子”模型以10亿参数,登顶中文语言理解权威评测基准CLUE;孟子新一代认知服务引擎在HICOOL 2021全球创业大赛中荣获一等奖暨人工智能和金融赛道第一名。

4月底在接受《中国企业家》专访时,周明表示,他们最近又新推出了孟子GPT大模型,面向To B领域,服务企业典型场景,帮助企业降本提效。

以下为周明的采访整理,有删节。

两条腿走路

2022年11月30日,ChatGPT的公布让我眼前一亮。

过去,我觉得大模型是未来,但没有想到它这么快进入普通人的视线。大家都可以用(ChatGPT),而且效果如此之好,这令我非常吃惊。

我立刻意识到: 人工智能的新时代要来临了。

于是,从去年12月起,我们开始行动。为了“抢跑”,我们克服困难,马上准备算力、搜集和清洗数据等工作,然后开始训练模型。在花费巨大努力后,我们终于训练出一个有多轮对话问答能力的模型 (孟子GPT模型)。

现在回看, 我们算国内最早动起来的团队之一,因为我们过去两年来通过孟子模型积累了算法、工程、数据等各方面的能力,所以动起来相对比较快。

从1985年开始,我就一直从事自然语言的研究,经历过NLP的规则系统、统计模型、深度学习模型等各个时代。2017年谷歌推出Transformer的时候,我们在微软亚洲研究院也马上做了一些大模型的尝试,包括融合了BERT和GPT的优点的统一的预训练模型(UNILM)。在这过程中,我逐渐觉得大模型将是自然语言和人工智能的未来。

到了2020年,我有了创业的打算,我的设想是做一个特别好用的大模型,各行各业都可以即插即用,从而提高生产能力,所以孵化了澜舟团队。此后两年里,我们的团队就一直在做大模型。

但过程并不是一帆风顺的。一开始,我们想着炼一个大模型,但是发现代价很大。我后来仔细研究To B和To C的细分,认真分析了在这两条赛道上发展的优劣, 发现创业公司在To C业务上,跟大公司相比没有竞争优势,所以我决定优先发展to B业务。 后来我走访了很多客户,客户考虑到成本因素,建议我尽可能把模型轻量化。

我们当时考虑的是做To B业务,一旦拿到单子,企业就有了现金流,对增强团队信心有很大帮助。所以我决定应该先在B端炼轻量化模型。发展起来后,可考虑用To C的方式来获客。

澜舟现在的发展路线也是如此,主要做To B企业服务,将模型尝试应用在很多领域,如金融行业、网文娱乐、营销广告等。企业服务做好之后我们就有现金流回来,从而将技术打磨得更好,实现滚动式发展。

此外,我们也做了像翻译、文本生成、小说生成等To C业务借以获客。 虽然用户付费意愿比较低,但如果有用户喜欢,能够帮助推广产品品牌或转换付费,形成传播/流量效应后,带来To B的合作客户。

在过去两年工作基础上,我们今年主要任务是,抓紧研究ChatGPT代表的新范式,用更多的数据、更大的模型,做出类ChatGPT模型(孟子GPT大模型),它不仅可以进行多轮对话、回答问题,也能把AI1.0的单功能引擎如翻译、搜索、信息抽取等无缝连接起来。

我们有充足的储备去支持这些工作。今年2月份,新一轮的融资已经到账,我们会把大部分资金用在算力、数据以及人才上,将To B模型做好,并获得收入,从而实现正循环。 我向往“两条腿走路”,一方面炼模型,一方面用模型,两者构成反馈链,加速各自能力的提升,打造一个创新闭环。

做好“人”的功课

创立澜舟科技,是一个实现团队突破的过程。成功的要素很多,但是就像英伟达老板黄仁勋说的, “成功最重要的是韧性”,我对此深有同感。

从微软离开时,我没有带走团队任何一个人。这意味着起步非常困难。 我当时甚至觉得人应该给自己制造一点困难,你一旦克服了困难,就能达到勇气和能力上的更高境界。

刚开始创业时,整个团队只有我自己。不久,创新工场其他团队的几位伙伴被我吸引,觉得澜舟好像有“前途”,就主动加入进来。他们并没有NLP的背景,但是在我的鼓励下,努力开始在NLP领域学习,随后我又招了两名实习生,我们5个人就慢慢开始训练模型。

招聘是我们的“老大难”。 毕竟当时我们只是一个看不到明显前景的小型创业团队,也许唯一打动人的办法就是,跟面试者讲未来的机会和情怀。我也通过我的一些学生、我的老朋友等熟人的信任关系招进来第一批人,包括实习生,好不容易到了10个人。

我们这样一个“轻量化”的团队研发做出的孟子模型获得了中文预训练模型CLUE测评的第一名,我们随后又在北京HICOOL创新大赛获得最高奖。这些成绩为我们打开一定的品牌知名度,逐渐有人从各个渠道了解我们并加入进来,一点点滚雪球式地将团队发展成今天的50人团队,其中90%以上都是技术人员。

人才来了后,如何把他培养起来,并让他喜欢公司,也是一个很大的挑战。 因为团队逐渐有了名气之后,其他公司的“挖角”不可避免。

为此我们做了很多功课。首先是建立企业文化,为员工树立互助的职业发展观。我们试图打造一个大家互相帮助、互相成就、新人可以得到学习、锻炼和尊重的工作环境,并提供一个施展身手的平台。

第二是组织培训讨论等形式的交流会。我们一直有每月一次(ChatGPT出现后改为两月一次)的披萨DAY“传统”,员工们可以一边吃披萨,一边交流学习,增进彼此之间的理解。每次的披萨DAY都由员工们轮流组织承办,以此锻炼每个人的协调组织能力和沟通能力。

第三,我们还鼓励员工做内部/外部讲座,让他体验到学术水平上升的成就感。

除此之外, 我也不可避免地面临初创业时的茫然。 毕竟之前在微软研究院时,我作为研究员/科学家,只需要注重算法技术,其他各方面都有微软平台,或者同事帮忙照顾解决。但创业之后,平台红利没有了,方方面面都要靠自己,不仅要从零建设团队,还要自己去谈融资、业务等。

这对于我来说都是全新的尝试和考验。一开始谈投资的时候,每轮我都要见至少20~30家机构,最终可能只有一两家机构愿意投。在这过程中,对内,我们要做出项目的核心技术;对外,我要表述出我们的实力以及清晰的战略方向,还要掌握与投资人的沟通技巧。

如何实现业务盈利也成了我必须要考虑的事。 刚开始创业时,我既不知道用户在哪,也不知道用户需求是什么,这种情况下,做出的模型也很难被直接投入使用。

我觉得一定要走近客户,才能了解客户痛点,产出有用的产品。于是我们跟华夏基金成立一个联合实验室,经常走访,尽量了解对方的需求。 带着用户的反馈,不断完善大模型能力,让我们训练的大模型真正实用。

我们在过去两年炼大模型方面积累了很多经验,而且我们在To B业务上也建立了不错的合作伙伴关系和生态,从技术到落地形成了闭环。

在ChatGPT引发大模型热潮后,我们提出了更高的目标。要储备更多算力、数据,更快地迭代模型,更好地满足客户需求,实现应用落地。

在我的规划里,澜舟团队会保持短小精干的状态。今年我们有51人,明年可能达到100人左右,未来也不会猛涨。 炼大模型需要训练有素的人才,厉害的人1个可能顶10个。 我认为百人团队应该是可以长期稳定的一个规模。

科学家创业的必备要求

最近两个月,炼模型需要不断测试、修正、训练、调优等过程。我们团队的人都感到压力很大。

不过,我并不太着急,我觉得炼大模型不要太过于着急,不可能“毕其功于一役”,它是一个持续的过程。对每个组的工作,我们都做好了规划,设立了若干check point。大家按照既定方针,按照计划紧凑、有效、有序地往前推进就可以了。

我不会推着团队去“不舍昼夜”地加班。 我认为既然这是一个长期奋斗的过程,短期内不停加班赶出一个比较粗糙的模型发布出来,也许可以一时之间造势,但并不是长久之计。

某些大厂急于发布,肯定有自己的考虑,因为它可能希望造势,我们非常理解。而我追求的是稳扎稳打,把事情做得稳,真水平做出来, 尤其是To B企业服务,要做到令客户满意,这才是最重要的试金石。

作为领导,我要做好统筹布局,把握好每个人的方向,促进他们互相之间的配合,使得他们能最高效地工作,而不是强求他们的最长工作时间。

作为一名科学家/研究员转型创业,面对这个全新的“工作领域”,我觉得要做很多调整。

首先要磨炼心智,因为创始人需要做各种权衡,甚至有一些痛苦的决定。

其次要做前瞻性的思考。有时我会觉得焦头烂额,没有时间去思考未来的发展,因此我试图平衡自己的时间,比如利用周末去思考未来3-5年的发展战略,想得更明白后,再跟团队进行有效沟通。

在这过程中,我每次都抱着学习的态度,我知道自己换了新的领域、新的角色,会有很多我不清楚的地方,虚心请教别人、看一些资料,试图做出对我来讲最正确的决定,不固执己见,有人提醒(有道理)我就及时调整。

由于技术发展日新月异,我虽然不能保证像以前一样读paper、看书、看资料、使劲抠算法,但我一直保持清醒的进取心,新技术出现了,我就马上去学习,去了解它的大致思路,它有什么用、谁用了,适合不适合我们澜舟发展。如果适合,我会快速指定同事去了解,想办法用在项目中。

保持对新鲜事物、新鲜技术的好奇心,这是必备的。 因此,我日常的学习分散到了工作生活的点点滴滴中,比如朋友圈、新闻、论坛等等都是我的学习渠道;其次,我也会通过这些途径去与人交流,了解别人的看法。

第三就是要总结,我每周都会写周报,将我学到的知识、体会落到“纸面”上,再分享给同事们,这对于我来说是一个萃取提炼的过程,不仅能提升自己,也带给别人一些启发。

对于公司的未来发展,我给自己定下了十年的目标。 我想用10年的努力,形成有战斗力的公司文化,使它可以经受任何挫折,成为中国乃至世界上最有影响力的NLP团队。

上一篇:生态环境部启动2023—2024年黄河流域“清废行动”|天天看热讯 下一篇:最后一页
x
推荐阅读

澜舟科技周明:大模型创业,也可以小而美 世界今亮点

2023-05-19

生态环境部启动2023—2024年黄河流域“清废行动”|天天看热讯

2023-05-19

补碘食物 补碘_滚动

2023-05-19

国脉文化(600640):5月18日北向资金减持3.12万股

2023-05-19

观速讯丨征程的意思有哪些(征程的意思)

2023-05-19

宁波利时金融大厦

2023-05-19

六御大帝都是谁_六御_当前关注

2023-05-19

万用表测量电阻的原理_万用表测量电阻 天天快看

2023-05-19

环球热议:lol提前投降指令怎么发(lol提前投降指令)

2023-05-18

华为MateBook E 二合一笔记本测评:拆合都好用的移动办公多面手_天天新视野

2023-05-18

环球热推荐:宁波公交383路毛力支线

2023-05-18

做颈椎保健的5个步骤

2023-05-18

环球微动态丨鸟贝怎么做好吃?

2023-05-18

焦点精选!消息称美团外卖最快下周一登陆香港 将推姊妹应用

2023-05-18

边框怎么画简单又可爱的样式_边框怎么画简单又可爱_今日快看

2023-05-18

成果转化 聚焦前沿_天天即时看

2023-05-18

天天热议:确保农村低收入人口看病有保障 医保部门持续深化这些方面的改革

2023-05-18

现金流量分析的作用包括_现金流量分析的作用

2023-05-18

环球观察:并未出席联盟GM会议 勇士功勋GM离队成定局 烂摊子甩掉再回归吗?

2023-05-18

速看:到现场,面对面,这次考察接地气!甘孜州民营经济高质量发展大会参会代表实地考察康定市民营经济建设发展情况

2023-05-18

火炬之光无限怎么更改神格石板

2023-05-18

实时:公共 | 窑里不一漾!——大学生工作营用一周时间为浙江湖州南浔村庄带来新变化!

2023-05-18

家属称不接受判决结果,杭州女童坠亡案一审宣判

2023-05-18

5月18日 13:03分 三羊马(001317)股价快速拉升_环球快看点

2023-05-18

郑州公示9家违规住房租赁企业|全球聚看点

2023-05-18

5月18日上午收盘回顾:石基信息涨超10%,领涨微信小程序概念

2023-05-18

遵义市播州区司法局公开招聘城镇公益性岗位人员 焦点信息

2023-05-18

国家医保局:A股市值前10名药企中,2022年总研发投入是2018年的2.48倍

2023-05-18

环球快看点丨锂电装备产线引领行业技术创新 金银河亮相CIBF 2023

2023-05-18

Portworx by Pure Storage 宣布与 MongoDB 携手合作 为全面数据服务带来一致的开发者体验_焦点快报

2023-05-18

袍泽还是青衿是指古代的学士服_袍泽

2023-05-18

柠檬能和菊花一起泡水喝吗 柠檬和菊花适合一起泡水饮用吗

2023-05-18

怎么去掉图片上的水印文字在线(怎么去掉图片上的水印文字)

2023-05-18

天天动态:赛腾股份(603283):5月17日北向资金增持20.82万股

2023-05-18

苹果海外官网上架官翻版 2022 款 Apple TV 4K 世界最新

2023-05-18

武灵天下txt下载(武灵天下txt下载) 世界微速讯

2023-05-18

【世界速看料】无性别公厕成全球多国公厕建设新趋势,中国多城市也出现

2023-05-18

全球新资讯:温州S2线乐清牵引站输电与通信工程临时电改接正式电送电成功

2023-05-18

环国运拟注销参股公司国丰物联数智供应链(广东)有限公司

2023-05-17

河北省曲周县发布暴雨蓝色预警

2023-05-17

业绩“变脸”,微盟和有赞困在难盈利的“漫长的季节”

2023-05-17

V观财报|“中国影视娱乐第一股”华谊兄弟收函:存债务违约风险?

2023-05-17

环球视点!坏账损失的计算公式_坏帐损失核算方法

2023-05-17

每日钢市:期钢翻红,钢坯涨20,钢价涨跌互现-全球观焦点

2023-05-17

魅力非遗各美其美 《美在东方》绽放精致生活 世界快播

2023-05-17

第21届深圳国际小电机磁性材料展完美收官,明年再见!

2023-05-17

本川智能(300964)5月17日主力资金净买入1729.38万元

2023-05-17

史泰龙回归出演《绝岭雄风2》 故事主线首曝光

2023-05-17

笑果文化已被立案调查 任何人都不得侮辱军人-报资讯

2023-05-17

天天时讯:联想杨元庆预测:PC最早可能在2023年下半年恢复增长

2023-05-17

荣耀 90 系列渲染图曝光,预计本月底发布_全球微资讯

2023-05-17

兰州市社保查询系统

2023-05-17

梦幻西游手游星印怎么获得-当前时讯

2023-05-17

新moto razr定档6月1日:挑战小折叠手机最大副屏 环球今头条

2023-05-17

当前热文:天涯明月刀那个职业厉害 天涯明月刀哪个职业厉害

2023-05-17

喜剧冒险动画《飞兔大联盟》定档6.22 萌宠冒险乐翻端午

2023-05-17

港股异动 | 蔚来-SW(09866)早盘低开低走跌超3% 新款ES6开启预订 将于5月25日开始交付 世界滚动

2023-05-17

今日报丨仿冒新闻单位账号被清理,大快人心!

2023-05-17

鼎捷软件(300378)5月16日主力资金净卖出2697.10万元-全球热消息

2023-05-17

每年9100万助力民企攀登!济南优先将有关政策兑现资金列入预算

2023-05-17

山东:向“数智”要动力,拓发展新空间

2023-05-17

世界时讯:2023高考祝福短语10字之内 高考祝福经典语录

2023-05-17

阿里巴巴概念股板块5月16日跌1.63%,拓尔思领跌,主力资金净流出34.35亿元|焦点消息

2023-05-17

华晨宝马iX1申报图曝光 车身尺寸加长 全球播报

2023-05-17

山沟沟的姑娘完整版_山沟沟

2023-05-17

郑州这个多次引发事故的土堆,该由谁来处理?

2023-05-16

使用屏幕保护程序是为了延长显示器使用寿命_使用屏幕保护程序是为 精选

2023-05-16

张飞、赵云、马超能打败张郃,为什么不用弓箭射杀张郃

2023-05-16

绍兴文理学院元培学院学校代码专业-天天快消息

2023-05-16

阿荣旗柞蚕文化体验中心项目稳步推进

2023-05-16

看看有没有你家!上海市新命名141个节水型小区 全球播报

2023-05-16

【全球新视野】龙芯中科:公司和浪潮等公司都有合作

2023-05-16

上思县公正乡:种桑养蚕促增收 农民走上致富路

2023-05-16

国开国际投资(01062.HK)5月16日收盘跌10.34%

2023-05-16

4月份国民经济运行延续恢复向好态势 多数指标同比增速提升 世界快消息

2023-05-16

世界观察:公司问答丨农发种业:目前的出口业务主要由公司所属湖北种子公司开展 主要出口国为巴基斯坦等

2023-05-16

【港股异动】JS环球生活(01691.HK)涨3.27% 世界快消息

2023-05-16

中南建设拟发行约11.47亿股股份,拟募资28亿元用于项目建设

2023-05-16

金融大鳄索罗斯因心脏病去世?本人发声辟谣:我还活着,很健康|世界微资讯

2023-05-16

雷特科技(832110)2023年一季报财务简析:营收净利润双双增长,盈利能力上升 世界观点

2023-05-16

异动快报:新经典(603096)5月16日13点13分触及跌停板

2023-05-16

中消协:加大对虚假宣传等侵害消费者合法权益行为的打击力度,让消费者愿消费|环球今日报

2023-05-16

车辆维修管理制度车辆维修管理制度_车辆维修管理制度

2023-05-16

脱口秀演员 House 疑侮辱人民子弟兵,本人道歉评论区沦陷

2023-05-16

国家统计局:1—4月份生产原煤15.3亿吨 同比增长4.8%

2023-05-16

看点:屏南:打好“人才牌”山村活起来

2023-05-16

环球即时看!采光计算软件_采光计算

2023-05-16

恒信东方:5月15日融券卖出金额41.07万元,占当日流出金额的0.52% 全球滚动

2023-05-16

环球快讯:专家建议完善立法 终结“剧本杀”野蛮生长状态

2023-05-16

今日聚焦!中信证券:家居震荡上行可期 纸基利润拐点将现

2023-05-16

三国杀台词 三国杀台词霸气

2023-05-16

帝王蟹怎么保存才新鲜(帝王蟹如果保鲜存活)|天天快看

2023-05-16

这次警告“不同于以往”?专家称美国经济衰退即将到来|当前简讯

2023-05-16

地下城与勇士官网 地下城与勇士私服发布网站|全球信息

2023-05-16

上综艺节目不允许染发?鹿晗吴亦凡或将受影响?

2023-05-16

亘喜生物(GRCL.US)Q1净亏损1.517亿元 研发支出增至1.375亿元

2023-05-15

资深IT技术专家陈皓突发心梗离世,年仅47岁 环球看点

2023-05-15

国家感染性疾病临床医学研究中心2023年学术年会在京举办

2023-05-15

当前热门:帝欧家居回复问询函:调整与部分风险开发商合作节奏为营收下滑主因

2023-05-15

每日速递:荷兰国际:需求低迷导致欧元区工业疲软

2023-05-15