八一中文网 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

至于为什么林灰不将生成式对抗网络搬出来?

林灰不想给外界其余的学术人员一种割裂感。

就像林灰在过往游戏开发(搬运)时不想给游戏玩家一种割裂感一样。

虽然林灰现在已经有了一定的将生成式对抗网络的推出逻辑基础。

(林灰此前搞得生成式文本摘要里面涉及到的生成式模型,而从伊芙·卡莉那收购来的专利中又涉及到类判别式模型,而生成式对抗网络其组成正是包含有生成式网路和判别式网路……)

但如果林灰贸然搞出生成式对抗网路依旧不是很好。

毕竟生成式对抗网络就应用层面来说和林灰现在一向搞得自然语言处理这一学术领域其实关系不太大。

在这种情况下,林灰莫名其妙推出一个和自然语言处理几乎没啥关系的模型算怎么回事呢?

虽然学术方面无心插柳柳成荫的例子很多,很多学术成果最开始问世的时候目的往往是跑偏的。

但林灰内心信奉的原则是注定了林灰不大可能打破此前延续的惯例。

无论是游戏开发还是学术进展上,林灰都不想给别人一种割裂感。

而且,科技树还是按顺序点比较好。

虽然说作为挂比不按顺序点科技树也可以。

但在多元化的社会下不按规矩办事往往就意味着风险。

乱点科技树,自己的科技逻辑链没形成。

潜在对手却形成了相应的发展脉络。

那么科技成果很有可能被对手所窃取。

这是林灰所不愿意看到的。

现在在林灰看来学术方面他所要做的依然是深耕自然语言处理。

深耕生成式文本摘要。

通过不断的深耕,从自然语言处理这一领域找到破局点

或者说点亮相邻于林灰已点亮科技成果的科技树分支才是最好的。

(林灰倒也不着急,即便是一时之间未找到合适的破局点其实也关系不大。

起码是一个月林灰还是不需要太担心的。

毕竟就生成式文本摘要这方面取得的“突破性进展(成功的搬运)”林灰最起码也能“混”一个硕士学位。

而这也是要林灰消化一段时间了。

其实林灰原本的估计更加乐观。

林灰原本是觉得将生成式文本摘要这个方向的论文搞清楚,就差不多能博士了。

不过通过最近跟伊芙·卡莉的交流,林灰觉得是他过于乐观了。

就像诺奖级成果不一定真的能获得诺奖一样。

就算林灰在生成式文本摘要方面鼓捣出的东西对于这个时空能称得上是博士级甚至更高级别的成果。

但想藉此一步到位获得博士毕业论文也是很有难度的。

毕竟此前林灰搞得学术内容其主要呈现形式都是围绕着生成式文本摘要这样一个算法专利的。

这个时空西方对于专利形式的学术成果更倾向于将之视作偏向于实践的东西,亦即工程上的成果。

而仅仅依靠工程方面的成果想要一步到位弄到博士方面的成果是很麻烦的。

虽然涉及到生成式文本摘要在学术上的收益这个稍微低于林灰的预期,不过问题不大。

林灰觉得学术上步子太大也不完全是好事情。)

既然短时间不搬运生成式对抗网路。

那刚才关于生成式对抗网路的思考岂不是等同于白白浪费脑细胞?

当然不是。

很多时候思维大概就是在一些漫不经心的思考中获得新的启发的。

关于生成式对抗网路这方面的思考,林灰突然意识到他还有一笔巨额的隐形财富。

那就是前世的人工标注数据。

虽然没太认真翻看前世一同携带来的信息。

但人工标注的数据林灰不可能是没有的。

尤其是前世那些企业级硬盘里面绝对不可能没有人工标注数据。

就算没啥图像的人工标注,涉及到一些文本的人工标注,绝对是不可能少了的。

毕竟这种东西相当实用,而且文本标注其实也不是很占地方。

要知道涉及到神经网路学习训练或者说深度学习训练在模型构建的时候可是需要大量的人工标注数据的。

尤其是监督学习和半监督学习更是需要大量的人工标注数据。

通常一个模型在架构的时候需要很多的人工标注的数据。

在调整的时候也需要很多的人工标注数据。

举这样一个例子:

在图象识别里面,经常我们可能需要上百万的人工标注的数据,

在语音识别里面,我们可能需要成千上万小时的人工标注的数据。

涉及到机器翻译更是需要数千万语句标注数据。

说实话作为一个来自前世往后几年的技术人员。

此前涉及到人工标注数据的价值林灰还真没太当回事。

但现在看来,这玩意的价值此前明显被林灰忽视了。

林灰记得在前世2017年看到的一组数据说得是涉及到人工翻译的话。

一个单词的费用差不多是5—10美分之间,一个句子平均长度差不多是30个单词。

如果需要标注一千万个双语句对,也就是我们需要找专家翻译一千万句话,这个标注的费用差不多是2200万美元。

可以看到数据标注的费用是非常非常高的。

而这仅仅是2017年的数据标注成本。

在现在的话标注成本岂不是意味着更高的数据标注费用?

要知道现在几乎不怎么注重无监督学习。

在无监督学习方面更是几乎没啥可堪一用的模型。

在主流的机器学习依旧是靠监督学习和半监督学习。

而举凡是监督学习和半监督学习基本就离不开人工标注的数据。

以这个角度来衡量的话林灰所拥有的一大批现成的人工标注数据岂不是一笔巨额的隐形财富?

如果说在前世2017年,1000万条双语数据标注就要耗资两千多万美元。

那么在机器学习整体比较滞后的这个时空的2014年。

同样的1000万条双语数据标注需要多少钱呢?

林灰觉得1000万条双语标注数据怎么着也得要个两三亿美元啊。

“两三亿美元”这个数据似乎有点吓人。

但其实也不夸张。

喜欢穿越:2014请大家收藏:(www.81zww.net)穿越:2014八一中文网更新速度全网最快。

八一中文网推荐阅读: 鉴宝金瞳超级无敌小神农这个穿越有点早重生修仙在都市桃运神戒妖孽仙皇在都市我的1979归一你好,我的1979神豪之我真的不想高调开局顶流的我怎么会糊山泉客栈有点仙神级紫荆花牧场异国猎宝档案饲养全人类创造营之老板我会努力的地产之王新零售时代桃缘山神修真聊天群我苟起来很稳健半岛巫师重生之完美一生国际寻宝王大王饶命土地爷的幸福生活我拍戏不在乎票房极品都市风水师开局十个亿钱随便花超级度假村大亨都市之神级选择系统这座高校由我来守护祖传土豪系统身价千亿的我,靠主播老婆养活我不是神豪隐杀女总裁的全能兵王医武狂兵我儿子成了反派舔狗高山牧场生活系游戏我的派派能提现天天带早餐,还说是高冷校花?位面官商重生之最强星帝重生之财源滚滚都市:我每周一个新身份至尊战神女婿重生之校园威龙全球塔防:我打造了亿万黑暗军团
八一中文网搜藏榜: 深空彼岸夜的命名术大时代从1983开始空间渔夫医路坦途重生过去从四合院开始超凡透视这个医生不缺钱你好,1983脑海里飘来一座废品收购站寻宝神瞳重生之实业大亨重生之金融巨头这个医生很稳健明克街13号这个穿越有点早稳住别浪顶级神豪超品农民巨星从解约开始都市至强者降临整座大山都是我的猎场九眼天医官道无疆生活系游戏我是如何当神豪的手术医生开外挂我能升级万物中医许阳文娱教父:开局蹭演唱会还看今朝手术直播间我真不想跟神仙打架大国机修从情满四合院开始穿越都市奇门医圣重塑千禧年代疯了吧,你管这叫实习律师留给未来的自己都市:从急诊科开始临时加彩礼,反手娶了路过女主播我的投资时代雪洗天下重生之搏浪大时代隐居在娱乐圈重生过去的逍遥人生三界淘宝店签到,人在孤岛,刚自建豪华别墅我真没想重生啊文娱:从经纪人到国际巨星
八一中文网最新小说: 汽车公司?不,是国货之光我的金融帝国热搜第一:叫你捡漏你开挂啊我写的娱乐文被杨老板看到了百元求生:从潘家园捡漏开始放弃留学,我打造了世界第一名校娱乐:别联系了,真不熟从重生开始合租浪在娱乐圈奶爸,开局校花找上门,当爸了?我的夫妻关系竟能数据化我靠吹牛发家致富回到过去当女神硅谷大帝好莱坞制作星媒舵手四合院里的老中医地窟求生:开局食物增幅三十倍再启仙途文娱:让你唱歌,你搁这作法?带着爸妈去上班武侠之父四合院里的唯一老实人首富后才知是反派怪物食堂韩娱之kpopstar平行空间重生之叱咤风云墙头有杏美女身边的金牌高手总裁大人进错房火爆兵王我意花丛极品调教重生圣尊校园邪神传全系炼金师极品护花神医乾哥传奇纨绔邪神邪帝校园行特种兵痞在校园冰帝校园行贴身妖孽极道特种兵邪霸都市极品学生校园纨绔特工无敌保镖都市透视眼