1. 首页
  2. 科技

作业帮,一家科技公司

作业帮,一家科技公司

“7岁了,继续奔跑。”1月15日,作业帮创始人、CEO侯建彬在朋友圈里感叹。

过去一年,作业帮发展尤其迅速,一年获得两轮融资,给原本热闹的K12在线教育市场再再配了一把火。

2015年的时候,作业老大还是一个较小的APP,团队也较小,一张照片就放得下。6年后的今天,作业帮已经成为中国唯一月活用户过亿、唯一进入全网top30的教育类APP,员工总数多达35000人。

作业老大团队.2015年

K12在线教育正身处风口。iMedia Research预计,政策受到影响、技术成熟的推动下,2020市场规模达4858亿元,增速202%。也是在这样的背景下,在线教育行业迎来了密集融资。网经社“电数宝”电商大数据库表明,2020年在线教育行业共发生110起融资,融资额超540亿元,其中,作业老大就占到了约30%。

市场竞争激烈,人们叫得上名字的应用于就有数个,但持续占据头部的不多。作为正式成立仅仅5年的在线教育公司,作业帮究竟凭什么能一路高歌猛进?

前特劳特中国公司高级咨询师顾均辉指出,关键就在于作业帮对照片搜题的探讨。“这一技术突破必要关系到用户体验,也对同类产品带来了‘降维压制’。作业老大从而一跃沦为师生与家长心智中最好用的搜题品牌。”

作业老大入局前,在线教育市场竞争就已相当白热化。但通过聚焦拍照搜题,作业帮在已经相对成熟期的市场中出奇制胜,成为K12在线教育市场的一匹黑马。而且,6年来,不断完善的拍电影侦技术体系,在作业帮的各个业务环节中发挥了“杠杆”起到,为其后续发展打下了扎实的基础。

01一个super机会

时间回到2013年,这是K12教育行业的一个转折年。

这一年,辞任世纪佳缘CEO的龚海燕创办的梯子网更有了大众的注目,也搅起了BAT对在线教育的好奇心。

彼时,在百度内部,百度知道的负责人侯建彬找到,K12领域的发问量占了搜索总提问量的10%。他隐约觉得,这是一个巨大的需求,可以承托起一个独立的APP。

2014年1月,作业帮正式上线。基于百度告诉的积累,作业老大首先推出以问答和圈子为主的UGC社区。但运行一段时间后,问题也开始显出,解说质量不高,时效性得不到确保,这对正在做作业的提问者来说并不方便。

龚海燕曾表示,自己做梯子网,是想给教育资源脆弱的地方搭建一座梯子,从而转变学子的命运。梯子网自由选择的是做社区,更有老师、学生住进的模式。但后来事实证明,这一模式缺少商业承托。

此时,K12正处于题库创业高峰期。猿题库、学霸君等在题库的基础上,根据用户的需求开始发售了照片搜题功能。

“拍题是一个super的机会。”侯建彬判断,拍题是可以做日活千万级以上的,而且它重新开辟了一个之前从来没存在过的、线上的学习场景。

市面上的一些创业公司希望使用照片搜题的方式,帮助用户解决实时性的问题,但是,由于技术的原因,此时的拍照搜题的效率和准确率都不高。

照片捜题准确率提高的关键,在于题库的累积以及成熟期的OCR(光学字符识别)技术。在这两方面,百度都有一定优势。侯建彬认为,这是作业老大的机会。

2015年1月19日,在作业帮上线一周年之际,具有拍照搜题功能的4.0版本正式上线。当天,它的活跃用户数第一次超过了100万。

作业老大的B轮投资人,GGV纪源资本投资副总裁于红说,当时市面上,K12有很多种模式,但她笃定作业老大照片搜题是流量入口的路径是对的。

照片搜题功能上线的同时,市场上也有很多批评的声音,指出是在变相协助孩子遗文作业。

“最早所有人都会有这个困惑。我一开始也想要,我们做到照片搜题这个东西是不是就是给人抄答案的?因为动机给人感觉不是那么的正向,都不想坚决去做。”作业老大拍照搜题的负责人王岩说道,为此他们特地做了一次用户调研。

他们打了很多电话,调研用户的自学情况。结果出乎意料,他们找到,绝大部分用户都是成绩中等偏上的学生。真正成绩劣的学生,他们要么不写作业,要么遗文现成的,根本不会费事去用于作业老大。

“它是真正有教育价值的。对于大部分想通过教育改变人生的学生们,拍电影搜上的解析、视频等在线资源,是一个非常宝贵的信息来源。”王岩坚信,作业帮对于更广大希望学会知识的同学带来的益处,是远远大于其可能带给的弊端。

而为了防止学生们只是用来抄题,作业老大的拍电影侦也做了很多特别的设计,比如绝大多数题目都获取详细的解析,不是不能看到答案;利用智能算法对用户疑为仅仅看答案的不道德,进行一些提醒和数量上的限制。

今天,很多学生在做家庭作业时,遇到会做到的题目,不用再等着“问老师”,而是打开诸如作业老大这类的App,给题目拍一张照片。数据显示,全国每10个孩子就有7个在作业老大自学。

“我自己没念过几年书,我期望我儿子不要走我的老路,需要好好读书,改变命运。”王建坤对《商业与生活》说道,现在孩子上小学5年级了,老师留家庭作业他已经辅导不了了。每次孩子遇上会的题目,都是用作业帮的照片搜题,自己给孩子批改作业也必不可少这个软件。

拍照搜题已经成为学生们的一种主要学习方式,在一定程度上给教育资源脆弱的学生搭建了一座梯子。

02“不那么性感”的改良

5年前,多个创业团队都曾杀进拍照搜题领域,也受到了学生们的欢迎。但如今,这些创业团队都已经在业务上分道扬镳,沿着各自的路径越走越远,只有作业老大攻下了这个优势。

目前作业帮旗下产品累计激活用户超8亿,总日活用户多达5000万,总月活用户超1.7亿,占有了中国K12在线教育流量外侧75%以上的份额。作业帮APP也是中国唯一月活用户过亿、转入全网top30的教育类APP。

罗马不是一天建成的,作业老大的拍搜优势,则是靠一行行代码积累一起的。

“我在作业帮的前三个月,比我在百度4年写出的代码都多。”作业老大智能技术实验室负责人王岩说。王岩主要负责管理作业帮照片搜题,照片批改,题库等一些业务的技术工作。

起初,作业帮用的还是第三方服务的OCR接口,这个模块仅次于的问题就是速度慢,识别一张图要10秒。

作业老大提出期望需要把辨识的速度加快。但对于一家大型服务供应商而言,作业帮只是一个小项目,根本不推崇它的需求。但作业老大自己确切,识别的效率就是公司的生死线,于是要求放弃用于第三方服务,自己研发拍电影侦系统。

2015年4月,侯建彬明确提出了“攻克天王山”,要把识别的时间从10秒到3秒。当时,公司里并没有专门习过图片辨识的员工,任务就被分到了王岩和程童所在的团队。

王岩真诚,一开始,他们并不具备提升辨识速度的能力。在使用第三方服务的OCR模块时,他们为了减少用户等待焦虑的问题,甚至做了一个“虚假”的进度条,第一秒就进行到90%,只剩的10%慢慢走,让用户觉得马上就能出结果了。或者故意把照片转动的过程设计的比较慢,让用户实在是自己手机反应快的问题。这也是他们当时唯一能想起的办法了。

由于之前没有涉及的经验,王岩的前期效率非常低,基本上每天都要把前一天写的代码全部推翻新的写。那段时间,他们做得非常艰辛,将近两个月的封闭时间,他们一周六天,每天都工作超过12个小时,一边学习一边思索,终于做到了出来。

这一进步给了团队极大的信心。随后,作业老大进一步成为业内第一家把辨识号召优化到1秒的公司。时效和体验,一举奠定了作业帮在同类产品中夺下第一,并将这一流量优势持续到了今天。

一行行的代码,一点点的提升,这不是一个像融资,像市场推广那样有性感故事可讲的过程。这更像是一个乏味的自我折磨。

但在侯建彬看来,就是这个看起来不那么性感的改进,起着了非常关键的作用。教育产品的增长还是要看口碑,用户在乎的是服务的质量。面对白热化的市场竞争,作业帮要保证优势的唯一办法就是要做,人无我有,人有我优。

03海平面下的技术进阶

一个典型的小学数学题,辨识起来并不简单。一个熟悉计算机视觉和深度自学的学生利用公开的资源和一些数据集,就可以搭出来一个系统。

但是,当用户上了规模,市场需求和场景就变得复杂,何况作业帮总计转录用户设备多达8亿。

由于人们的拍摄环境,拍摄的题目,乃至使用的设备,都是五花八门的。有的拍的模糊,有的灯光明亮,还有的题目上已经被写满了草稿,这都给拍电影搜系统明确提出了挑战。

市面上很多同类软件,或多或少都会经常出现答案和所拍照片题目不一致的现象,反而浪费了学生的时间。

作业老大的拍搜系统,基于OCR和深度自学技术的融合,经过持续6年的自主研发和数据累积,目前拥有多项OCR、检索和系统专利,功能也在不断拓展,从最初拍电影单题,拍电影整页,再到猜你想要拍,从搜索答案,到批改,再到评分。数据显示,其小学数学作业的测验整体准确率已经超过98%,而且最快1秒出结果。

人们看到的结果,往往只是冰山一角。海平面则是可观的技术、数据支撑。

程童在作业老大还在百度内部产卵的时候就选择了重新加入,参予了作业帮拍题搜索系统从0到1的搭起过程。据他介绍,拍侦算法架构比较复杂,主要分成OCR和检索两个部分。

其中检索系统主要任务是通过辨识出有的文本检索答案,由上至下依次包含终端和策略层、正排系统、倒排系统和离线建库四个主要部分,整体是一个由很多模块构成的复杂系统。而OCR系统主要是将所拍照片内容辨识成文本,主要是由多个策略&预处理模块,以及大量使用GPU作为运算设备的深度学习在线推理服务构成。

针对不同用户用于场景下可能经常出现的模糊、弯曲、较低像素、干扰等等各类拍照问题,作业帮不断展开算法迭代和架构完备。现在,在一次原始的文字识别流水线里,会有多达30种有所不同的神经网络各司其职,运行260次以上的神经网络预测。而通过建构大规模的并行GPU集群,这样一次比较重的辨识流程,平均值只需要200毫秒。对于辨识出的题目内容,则会在索引量超过3亿的题库搜索引擎中展开给定,保证给到用户的信息尽可能准确。

程童说道,过去六年,作业帮的拍侦系统一直都在变化。

早期,因为大家识别响应普遍都慢,谁能把响应时间延长,谁就能够赢得用户的注目。当快到一定程度,准确率又成了一个关键点。准确率越高越更容易形成口碑传播。

当时,大家都用于CPU服务器跑完算法模型,性能较低耗时宽。作业帮率先将GPU用作在线推理服务,预处理的部分交给CPU,深度神经网络则利用GPU强劲的并行运算能力去计算出来,上线后就取得了10倍的加速效果,构建了“随手一拍电影,秒出答案”。

进入2017年前后,随着原有业务流量很快上涨,算法模型的种类和数量的不断减少,给研发和运维上带给了更大的压力。

“业务做不一起,系统做到的再漂亮也没有意义。”程童说道,为了让模型快速上线,他们上线了很多临时方案,但也让他们的系统管理运维的包袱越发沈重。

虽然业务优先,但程童告诉,如果任由系统退化下去,不但自己会疲于奔命到处救火,最终也会影响业务发展。所以在项目间歇期、流量低峰期,拍侦团队都会见缝插针进行系统优化,减少技术债务。比如,针对环境异构的问题,他们通过升级接入层,优化自研rpc(远程过程调用)客户端,符合多机房,多机型阻抗平衡以及实验分流的市场需求,使得流量的终端几乎可以漠视机型机房的区别。

现在,随着业务相对成熟,系统成长到了一定规模,他们新的审视之前系统发展过程中的各种问题,深挖本质,最终选择了通过虚拟化的方案予以解决问题。迁入后,通过更细粒度的资源分配和服务混部,一些集群最多节省了50%的机器资源。而通过迁移取得的弹性前端能力,也让拍电影搜系统在应付流量高峰的时候更加游刃有余。

“我们对指标的拒绝一直在提升,原来是到90%,后来到95%,再到99%。难度是在于准确度不停的往前探寻,我们的基础提高以后,你想再前进一步,难度不会是指数级别的减少。”程童说。

04做一家教育科技公司

2015年6月,作业老大从百度正式拆分出来,新的公司取名为“小船上岸” 。当时,侯建彬通过各种关系终于找到了有教育背景的所晖,希望他能兼任牵头创始人。所晖问了他一个问题:作业帮是想做到一家“教育”公司,还是“科技”公司?

“做到教育科技公司”,侯建彬当斩钉截铁地问。

谈到教育创业,也许有人指出,要想要夸奖,只需要打造出优质师资团队就足够了。这种想法显然忽略了一个关键,在线教育与传统教育仅次于的有所不同,就在于技术的力量。

通过用户的拍照搜题内容,作业帮还不会通过大数据算法来分析重点、难点和全网的自学进度。比如,他们发现山东潍坊的学生,花时间最多的是“多项式乘多项式”这个知识点,而在陕西西安,花上时间最多的知识点是“平行四边形的判定”。这样一来,就可以针对有所不同城市的学生,提供出更加有针对性的课程或是自学工具、自学资料,集中力量解决问题难点,使得更多的学生获益。

而作业老大正是凭借着人工智能、直播、5G、大数据等技术的赋能,为教育建构更多有可能的同时,也从一众竞争者中脱颖而出。

现在,作业老大已经做了五六年的照片搜题了,不仅占有了在线教育最大的流量入口,也为旗下之后产卵出王牌业务在线直播课持续获取转化学员。王岩相信,基于前面的累积以及人工智能技术的不断发展,未来的解题和在线学习,一定可以走进题库,通过理解背后的科学知识,自动解题,甚至会分解讲解视频和课程帮助学生进步。

曾经,融资后,有人问侯建彬,你们也做到了很多AI的事情,为什么都没提到说你们是AI+教育公司。侯建彬说道,“我害怕大家以为我们跟那些炒概念的公司是一样的,没有必要托。”

技术永远是为业务和市场需求场景服务的。作业帮没故意谈过AI,但十分重视用户第一。16亿美元的E+轮融资,也再一次证明,科学技术本身没有温度和创造力,而真正绽放无穷力量的是产品。

对作业帮而言,拍照搜题的提出,是迎合AI时代对教育的一种创新。而照片搜题也为计算机视觉技术以及人工智能技术的落地获取了良好的落地契机,为传统教育的改革带给了新的方向。

声明:本站转载此文目的在于传送更多信息,并不代表赞同其观点和对其真实性负责管理。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间移除内容,本网站对此声明具备最终解释权。

声明:本站转载此文目的在于传送更多信息,并不代表赞同其观点和对其真实性负责。如牵涉到作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间移除内容,本网站对此声明具备最终解释权。