一张图看懂人工智能Ai


    张图懂工智Ai

    导读

    工智目创造智力电脑(假设机器)希电脑智力样处理务理工智包括机器做容工智广泛概念质数模型现问题(existing problems)提供解决方法(solutions)

    工智定义分两部分工智工较理解争议性智水直接反映出系统智程度工智分强工智弱工智

    强工智通计算机构造复杂拥类智慧样质特性机器着感知(甚更)理性样思考电影里面机器

    弱工智 (ANI) 指擅长单方面工智垃圾邮件动识iPhone助手siriPinterest图分类Facebook脸识属弱工智现事领域

    总说工智研究领域断扩分支包括专家系统机器学进化计算模糊逻辑计算机视觉然语言处理推荐系统等




    工智三法宝: 数计算力算法

    解工智原理简单工智实通断吃数动处理数变聪明数训练越准备度越高企业逃离面三区域

    着工业现代化类分工越越密切试图掌握切知识力付出成越越高

    场景

    举例子:机器视觉指纹识脸识视网膜识虹膜识掌纹识专家系统动规划智搜索定理证明博弈动程序设计智控制机器学语言图理解遗传编程等属数具体实际运

    家建议

    果觉数处理较行话数获取分类方面钻研更深实投入工智行业怀抱

    果者贵公司做硬件设备者型分布式处理设计验话工智计算方面进行拓展非常错

    果觉算法数学功底话算法方面进行深入造诣

    然肯定部分需结合面三法宝进行应开发参数调优实际应AI解决生产生活问题错转型方

    10分钟带读完工智三生三世


    文AI基模块(计算机视觉语音识然语言处理决策规划系统)着手回顾路发展脉络史镜正视未

    AI作2016年热门词汇持法:怀疑泡沫破裂坚信场变革会带巨机会抛出威胁

    系列试图通俗易懂方式知识水读者中获益:外行工智清晰客观理解帮助行更参AI带场产业变革中

    文会AI基模块(计算机视觉语音识然语言处理决策规划系统)着手回顾路发展脉络史镜正视未

    1 计算机视觉发展历史

    类生俱力刚出生婴需天时间学会模仿父母表情复杂结构图片中找关注重点昏暗环境认出熟着工智发展机器试图项力匹敌甚超越类

    计算机视觉历史追溯1966年工智学家Minsky学生布置作业中求学生通编写程序计算机告诉通摄头什认计算机视觉早务描述

    七八十年代着现代电子计算机出现计算机视觉技术初步萌芽开始尝试计算机回答出什东西首先想类东西方法中获鉴

    鉴时普遍认类理解事物类通两眼睛立体观察事物想计算机理解图必须先事物三维结构二维图中恢复出谓三维重构方法
    鉴二认识出苹果已知道苹果先验知识苹果红色圆表面光滑果机器建立样知识库机器图库里储备知识进行匹配否机器识理解东西呢谓先验知识库方法

    阶段应光学字符识工件识显微航空图片识等等

    九十年代计算机视觉技术取更发展开始广泛应工业领域方面原CPUDSP等图处理硬件技术飞速进步方面开始尝试算法包括统计方法局部特征描述符引入

    先验知识库方法中事物形状颜色表面纹理等特征受视角观察环境影响角度光线遮挡情况会产生变化

    找种方法通局部特征识判断事物通事物建立局部特征索引视角观察环境发生变化较准确匹配

    进入21世纪益互联网兴起数码相机出现带海量数加机器学方法广泛应计算机视觉发展迅速许基规处理方式机器学代动海量数中总结纳物体特征然进行识判断

    阶段涌现出非常应包括典型相机脸检测安防脸识车牌识等等

    数积累诞生许评测数集权威脸识脸识台——FDDBLFW等中影响力ImageNet包含1400万张已标注图片划分万类里

    2010年助深度学力量计算机视觉技术爆发增长产业化通深度神网络类视觉相关务识精度幅提升

    全球权威计算机视觉竞赛ILSVR

    (ImageNet Large Scale VisualRecognition Competition)千类物体识Top5错误率2010年2011年时分2822582012年引入深度学续4年分1641176737出现显著突破

    效果提升计算机视觉技术应场景快速扩展较成熟安防领域应外应金融领域脸识身份验证电商领域商品拍搜索医疗领域智影诊断机器车作视觉输入系统等包括许意思场景:片动分类(图识+分类)图描述生成(图识+理解)等等

    2 语音技术发展历史

    语言交流类直接简洁交流方式长久机器学会听说实现类间障碍交流直工智机交互领域梦想

    早电子计算机出现前机器识语音梦想1920年生产Radio Rex玩具狗世界早语音识器喊Rex时候狗够底座弹出

    实际技术真正语音识通弹簧弹簧接收500赫兹声音时会动释放500赫兹恰喊出Rex中元音第振峰

    第真正基电子计算机语音识系统出现1952年AT&T贝尔实验室开发款名Audrey语音识系统够识10英文数字正确率高达98

    70年代开始出现规模语音识研究时技术处萌芽阶段停留孤立词词汇量句子识

    世纪80年代技术取突破时代重原全球性电传业务积累量文文作机读语料模型训练统计研究重点逐渐转词汇量非特定连续语音识

    时变化基统计思路代传统基匹配思路中关键进展隐马尔科夫模型(HMM)理应趋完善

    工业界出现广泛应德州仪器研发名Speak& Spell语音学机语音识服务商Speech Works成立美国国防部高级研究计划局(DARPA)赞助支持系列语音相关项目

    90年代语音识基成熟时期流高斯混合模型GMMHMM框架逐渐趋稳定识效果真正实定距离语音识研究进展逐渐趋缓

    80年代末90年代初神网络技术热潮神网络技术语音识提出层感知器隐马尔科夫模型(MLPHMM)混合模型性法超越GMMHMM框架

    突破产生始深度学出现着深度神网络(DNN)应语音声学建模中陆续音素识务词汇量连续语音识务取突破

    基GMMHMM语音识框架基DNNHMM语音识系统代着系统持续改进出现深层卷积神网络引入长短时记忆模块(LSTM)循环神网络(RNN)识效果进步提升许(尤场)语音识务达进入日常生活标准

    Apple Siri首智语音助手Echo首智硬件入口等等

    应普进步扩充语料资源收集渠道语言声学模型训练储备丰富燃料构建规模通语言模型声学模型成

    3 然语言处理发展历史

    类日常社会活动中语言交流体间信息交换沟通重途径机器言否然类进行交流理解表达意思作出合适回应认衡量智程度重参然语言处理成绕开议题

    早世纪50年代着电子计算机出现出现许然语言处理务需求中典型机器翻译

    时存两派然语言处理方法:基规方法符号派基概率方法机派受限时数算力机派法发挥出全部功力规派研究略占风

    体现翻译认机器翻译程解读密码试图通查询词典实现逐词翻译种方式产出翻译效果佳难实

    时成果包括1959年宾夕法尼亚学研制成功TDAP系统(Transformation and Discourse Analysis Project早完整英语动剖析系统)布朗美国英语语料库建立等

    IBM701计算机进行世界第次机器翻译试验简单俄语句子翻译成英文苏联英国日等国家陆续进行机器翻译试验

    1966年美国科学院语言动处理咨询委员会(ALPAC)发布篇题语言机器研究报告报告全面否定机器翻译行性认机器翻译足克服现困难投入实

    篇报告浇灭前机器翻译热潮许国家开始消减方面费投入许相关研究迫暂停然语言研究陷入低谷

    许研究者痛定思痛意识两种语言间差异仅体现词汇体现句法结构差异提升译文读性应该加强语言模型语义分析研究

    里程碑事件出现1976 年加蒙特利尔学加联邦政府翻译局联合开发

    名TAUMMETEO机器翻译系统提供天气预报服务系统时翻译630万词天翻译12千篇气象资料够通电视报纸立公布

    欧盟日纷纷开始研究语言机器翻译系统未取预期成效

    90年代时然语言处理进入发展繁荣期着计算机计算速度存储量幅增加规模真实文积累产生互联网发展激发出网页搜索代表基然语言信息检索抽取需求出现然语言处理热情空前高涨

    传统基规处理技术中引入更数驱动统计方法然语言处理研究推新高度机器翻译外网页搜索语音交互话机器等领域然语言处理功劳

    进入2010年基数浅层深层学技术然语言处理效果进步优化机器翻译效果进步提升出现专门智翻译产品话交互力应客服机器智助手等产品中

    时期重里程碑事件IBM研发Watson系统参加综艺问答节目Jeopardy赛中Watson没联网4TB磁盘200万页结构化非结构化信息Watson成功战胜类选手取冠军世界展现然语言处理技术达实力

    机器翻译方面谷歌推出神网络机器翻译(GNMT)相传统基词组机器翻译(PBMT)英语西班牙语错误率降87英文中文错误率降58取非常强劲提升

    4 规划决策系统发展历史

    工智规划决策系统发展度棋类游戏载体早18世纪时候出现台棋机器击败时类棋手包括破仑富兰克林等终发现机器里藏着类高手通复杂机器结构混淆观众视线场骗局已

    真正基工智规划决策系统出现电子计算机诞生1962年Arthur Samuel制作西洋跳棋程序Checkers屡次改进终战胜州冠军

    时程序然算智已具备初步学力场胜利时引起巨轰动毕竟机器首次智力角逐中战胜类发出乐观预言:机器十年战胜类象棋冠军

    工智面困难想象跳棋程序败国家冠军未更层楼国际象棋相跳棋复杂时计算力机器想通暴力计算战胜类象棋棋手步棋均计算时长年单位意识减少计算复杂度类决高

    剪枝法应估值函数中通剔掉低性走法优化终估值函数计算剪枝法作西北学开发象棋程序Chess 451976年首次击败顶尖类棋手

    进入80年代着算法断优化机器象棋程序关键胜负手判断力计算速度幅提升已够击败顶尖类棋手

    90年代硬件性算法力等幅提升1997年场著名机战中IBM研发深蓝(Deep Blue)战胜国际象棋师卡斯帕罗夫类意识象棋游戏中已难战胜机器

    2016年硬件层面出现基GPUTPU行计算算法层面出现蒙特卡洛决策树深度神网络结合

    41战胜李世石野狐围棋战顶尖棋手60连胜30战胜世界排名第围棋选手柯洁着棋类游戏堡垒——围棋Alpha Go攻克类完美信息博弈游戏中已彻底输机器完美信息德州扑克麻中苟延残喘

    棋类游戏中积累知识验应更广泛需决策规划领域包括机器控制车等等棋类游戏完成历史命带领工智达新历史起点

    5 工智现

    时日工智发展已突破定阈值前次热潮相次工智更实种实体现垂直领域性提升效率优化计算机视觉语音识然语言处理准确率已停留家家水应场景新奇玩具逐渐真实商业世界中扮演起重支持角色

    6 语音处理现

    完整语音处理系统包括前端信号处理中间语音语义识话理(更涉然语言处理)期语音合成

    总体说着语音技术快速发展前限定条件正断减少:包括词汇量词汇量超词汇量限定语境弹性语境意语境安静环境场环境远场嘈杂环境朗读环境口语环境意话环境单语种语种语种混杂语音处理提出更高求

    语音前端处理中包含模块

    说话声检测:效检测说话声开始结束时刻 区分说话声背景声
    回声消:音箱播放音乐时暂停音乐进行效语音识需消扬声器音乐干扰
    唤醒词识:类机器交流触发方式日常生活中需说话时会先喊名字
    麦克风阵列处理:声源进行定位增强说话方信号抑制方噪音信号
    语音增强:说话语音区域进步增强环境噪声区域进步抑制效降低远场语音衰减

    手持设备场交互外许场景——车载智家居等——远场环境

    远场环境声音传达麦克风时会衰减非常厉害导致场环境值提问题显著放需前端处理技术够克服噪声混响回声等问题较实现远场拾音

    时需更远场环境训练数持续模型进行优化提升效果

    语音识程需历特征提取模型适应声学模型语言模型动态解码等程前面提远场识问题外许前研究集中解决鸡尾酒会问题

    鸡尾酒会问题显示类种听觉力场景语音噪声混合中追踪识少声音嘈杂环境会影响正常交流

    种力体现两种场景:

    注意力集中某声音时鸡尾酒会朋友交谈时周围环境非常嘈杂音量甚超朋友声音清晰听朋友说容
    二听觉器官突然受某刺激时候远处突然喊名字者非母语环境突然听母语时候声音出现远处音量耳朵立刻捕捉

    机器缺乏种力然前语音技术识讲容时够体现出较高精度说话数二更时识精度会折扣

    果技术语言描述问题质实定混合语音信号简单务中分离出特定说话信号噪音复杂务分离出时说话独立语音信号

    务研究者已提出方案需更训练数积累训练程磨逐渐取突破终解决鸡尾酒会问题

    考虑语义识话理环节更属然语言处理范畴剩语音合成环节

    语音合成步骤包括:文分析语言学分析音长估算发音参数估计等

    基现技术合成语音清晰度懂度已达较水机器口音较明显

    目前研究方包括:合成语音听起更然合成语音表现力更丰富实现然流畅语言混合合成方突破合成语音真正类声音异

    限制条件机器确实具备定听说力具体场景语音搜索语音翻译机器朗读等确实武

    真正做正常类样流畅沟通交流时日

    7 计算机视觉现

    计算机视觉研究方技术难度易难商业化程度高低次处理识检测分析理解

    图处理指涉高层语义仅针底层素处理图识检测包含语音信息简单探索图理解更层楼包含更丰富更广泛更深层次语义探索

    目前处理识检测层面机器表现已满意理解层面许值研究方

    图处理量训练数基础(例通噪声噪声图配)通深度神网络训练端端解决方案种典型务:噪声模糊超分辨率处理滤镜处理等

    运视频视频进行滤镜处理技术目前已相成熟类P图软件视频处理软件中处见

    图识检测程包括图预处理图分割特征提取判断匹配基深度学端端方案处理分类问题(识图片容猫)定位问题(识图片中猫里)检测问题(识图片中动物分

    里)分割问题(图片中素区域猫)等

    技术已较成熟图应包括脸检测识OCR(Optical Character Recognition光学字符识)等视频识影片中明星等

    然深度学务中扮演重角色

    传统脸识算法综合考虑颜色形状纹理等特征做95左右准确率深度学加持准确率达995错误率降10倍金融安防等领域广泛商业化应成

    OCR领域传统识方法清晰度判断直方图均衡灰度化倾斜矫正字符切割等项预处理工作清晰端正字符图文字进行识输出

    深度学出现仅省复杂耗时预处理处理工作更字准确率60提高90

    图理解质图文间交互执行基文图搜索图描述生成图问答(定图问题输出答案)等

    传统方法:基文图搜索针文搜索相似文返回相应文图图描述生成根图中识出物体基规模板产生描述文图问答分图文获取数字化表示然分类答案

    深度学直接图文间建立端端模型提升效果图理解务目前没取非常成熟结果商业化场景正探索中

    计算机视觉已达娱乐工具初级阶段

    片动分类图搜图图描述生成等等功作类视觉辅助工具需肉眼捕捉信息脑处理信息进分析理解交机器捕捉处理分析结果返回类

    未计算机视觉希进入理解甚分析决策高级阶段真正赋予机器力智家居车等应场景发挥更价值

    8 然语言处理现

    然语言处理中核心环节包括知识获取表达然语言理解然语言生成等等相应出现知识图谱话理机器翻译等研究方前述处理环节形成映射关系

    然语言处理求机器具备感知更难理解力中许问题直天未较解决

    知识图谱基语义层面知识进行组织结构化结果回答简单事实类问题

    包括语言知识图谱(词义位义词等)常识知识图谱(鸟会飞兔子会飞)实体关系图谱(刘德华妻子朱丽倩)

    知识图谱构建程实获取知识表示知识应知识程

    举例说针互联网句文刘德华携妻子朱丽倩出席电影节中取出刘德华妻子朱丽倩关键词然刘德华妻子朱丽倩样三元表示

    样刘德华身高174cm样三元表示领域实体三元表示组织起构成知识图谱系统

    语义理解然语言处理中难题难题核心问题形式意义映射中根前语境找种合适映射

    中文例里面需解决4困难

    首先歧义消包括词语歧义(例潜水指种水运动指坛中发言)短语歧义(例进口彩电指进口彩电指行动动作)句子歧义(例做手术父亲指父亲接受手术指父亲手术医生)
    次文关联性包括指代消解(例明欺负李批评需文知道批评调皮明)省略恢复(例老王子学错老张实指老张子学)
    第三意图识包括名词容意图识(晴天指天气指周杰伦歌)闲聊问答意图识(天雨句闲聊天雨关天气次查询)显性隐性意图识(买手机手机太久户想买新手机意图)
    块情感识包括显性隐性情感识(高兴考试没考户表示心情低落)基先验常识情感识(续航时间长褒义等时间长贬义)

    鉴种种困难语义理解解决方案利知识进行约束破解映射困局通知识图谱补充机器知识

    然克服语义理解困难距离机器显智障远远够需话理突破

    目前话理包含三种情形涉知识通专业次闲聊问答务驱动型话

    闲聊开放域存情感联系聊天性话 天天气真错呀出走走?闲聊难点通巧妙回答激发兴趣降低满延长话时间提高粘性

    问答基问答模型信息检索话般单轮次刘德华老婆谁?刘德华妻子朱丽倩1966年4月6日出生马西亚槟城…问答仅求较完善知识图谱需没直接答案情况运推理答案

    务驱动型话涉槽位填充智决策般轮次放首跑步听歌吧您推荐羽泉奔跑想听英文歌您推荐EminemNotafraid简单务驱动型话已较成熟未攻克方赖工槽位定义建立通领域话理

    历史然语言生成典型应直机器翻译传统方法种名PhrasedBased Machine Translation(PBMT)方法:先完整句话散成干词组词组分进行翻译然语法规进行调序恢复成句通译文

    整程起复杂中涉然语言处理算法包括中文分词词性标注句法结构等等环环相扣中环节出现差错会传导影响终结果

    深度学量训练数通端端学方式直接建立源语言目标语言间映射关系跳中间复杂特征选择工调参等步骤

    样思想早90年代提出编码器解码器神机器翻译结构进行断完善引入注意力机制(attention mechanism)系统性显著提高

    谷歌团队通强工程实现力全新机器翻译系统GNMT(Google Neural Machine Translation)代前SMT(Statistical machine translation)相前系统更通流畅错误率幅降

    然许问题解决生僻词翻译漏词重复翻译等否认神机器翻译性确实取巨突破未出境游商务会议跨国交流等场景应前景十分观

    着互联网普信息电子化程度日益提高海量数然语言处理训练程中燃料提供广阔发展舞台搜索引擎话机器机器翻译甚高考机器办公智秘书开始日常生活中扮演越越重角色

    9 机器学现

    工智层次机器学计算机视觉然语言处理语音处理等技术层更底层概念年技术层发展风生水起处算法层机器学产生重研究方

    首先垂直领域广泛应

    鉴机器学存少局限具备通性较狭窄垂直领域应成较切入口

    限定领域问题空间变足够模型效果够做更二具体场景训练数更容易积累模型训练更高效更针性三机器期特定具体期值高

    三点导致机器限定领域表现出足够智性终户体验相更

    金融律政医疗等等垂直领域成熟应已实现定商业化预见垂直领域重复性劳动未例会工智取代

    次解决简单凸优化问题解决非凸优化问题

    优化问题指考虑素表示组函数然中选出优解凸优化问题特性——局部优全局优

    目前机器学中部分问题通加定约束条件转化似凸优化问题

    然优化问题通遍历函数点定够找优值样计算量十分庞

    尤特征维度较时候会产生维度灾难(特征数超已知样数存特征数限导致分类器性反退化)凸优化特性通梯度降法寻找降方找局部优解会全局优解

    现实生活中真正符合凸优化性质问题实目前凸优化问题关注仅仅类问题更容易解决

    夜晚街道丢钥匙会优先灯光寻找样换种说法现缺乏针非凸优化问题行效算法努力方

    第三点监督学非监督学强化学演进

    目前部分AI应通监督学利组已标注训练数分类器参数进行调整达求性现实生活中监督学足称智

    类学程许建立事物交互中通类身体会领悟事物理解应未生活中机器局限缺乏常识

    卷积神网络父Facebook AI 研究院院长Yann LeCun通黑森林蛋糕喻形容理解监督学非监督学强化学间关系:

    果机器学视作黑森林蛋糕(纯粹)强化学蛋糕缺樱桃需样量Bits监督学蛋糕外层糖衣需1010000Bits样量监督学蛋糕体需数百万Bits样量具备强预测力

    强调樱桃必须出现配料意味着强化学监督学相辅相成缺

    监督学领域期研究重点生成抗网络(GANs)实现方式生成器(Generator)判器(Discriminator)两网络互相博弈生成器机训练集中选取真实数干扰噪音产生新训练样判器通真实数进行判断数真实性

    程中生成器判器交互学动优化预测力创造佳预测模型

    2014Ian Goodfellow提出GANs席卷顶级会议Yann LeCun 评价20年机器学领域酷想法

    强化学边更接然界生物学程源:果想象成环境(environment)中代理(agent)方面需断探索发现新性(exploration)方面现条件做极致(exploitation)

    正确决定早晚定会带奖励(positive reward)反会带惩罚(negative reward)知道终彻底掌握问题答案(optimal policy)

    强化学重研究方建立效真实世界存交互仿真模拟环境断训练模拟采取种动作接受种反馈模型进行训练

    10 工智未

    着技术水突飞猛进工智终迎黄金时代回顾工智六十年风风雨雨历史告诉验:

    首先基础设施带推动作巨工智屡次数运算力算法局限遇冷突破方式基础设施逐层推动行业应
    次游戏AI发展程中扮演重角色游戏中牵涉机抗帮助更直观理解AI感受触动起推动作
    必须清醒意识然许务工智取匹敌甚超越类结果瓶颈非常明显

    计算机视觉方面存然条件影响(光线遮挡等)体识判断问题(幅结构复杂图片中找关注重点)语音技术方面存特定场合噪音问题(车载家居等)远场识问题长尾容识问题(口语化方言等)然语言处理方面存理解力缺失物理世界缺少应(常识缺乏)长尾容识等问题

    总说现工智技术赖量高质量训练数二长尾问题处理效果三赖独立具体应场景通性低

    未工智定位绝仅仅解决狭窄特定领域某简单具体务真正成类样时解决领域类型问题类样进行判断决策谓通工智(Artificial General Intelligence AGI)

    具体说需机器方面够通感知学认知学理解世界方面通强化学模拟世界

    前者机器感知信息通注意记忆理解等方式感知信息转化抽象知识快速学类积累知识者通创造模拟环境机器通环境交互试错获知识持续优化知识

    希通算法学科交叉融合优化整体解决工智创造力通性物理世界理解力问题

    未底层基础设施会互联网物联网提供现代工智场景数生产原料算法层会深度学强化学提供现代工智核心模型辅云计算提供核心算力生产引擎基础计算机视觉然语言处理语音技术游戏AI机器等基样数模型算法应场景

    中存着亟攻克问题解决问题正步脚印走AGI必路

    首先数数

    深度学训练程需量工标注数例车研究需量标注车建筑物街景片语音识研究需文语音播报语音文听写机器翻译需双语句围棋需类高手走子记录等

    针规模数标注工作件费时费力工作尤长尾场景说连基础数收集成问题

    研究方数缺失条件进行训练标注数里进行学者动模拟(生成)数进行训练目前特火热GANs种数生成模型

    次模型模型

    目前深度学模型非常动辄百兆字节(MB)甚千兆字节(GB)甚十千兆字节(GB)

    然模型PC端运算成问题果移动设备会非常麻烦造成语音输入法语音翻译图滤镜等基移动端APP法取较效果

    块研究方精简模型通直接压缩更精巧模型设计通移动终端低功耗计算云计算间结合模型跑出模型效果

    感知认知理解决策

    类智感知认知部分视觉听觉机器定限定条件已够做足够然务难机器价值做更快更准成更低

    务基静态定输入情况输出结果定动态务中赢盘围棋开车路口路口支股票投资赚钱类完全信息决策型问题需持续环境进行交互收集反馈优化策略正强化学强项模拟环境(模拟器)作强化学生根发芽土壤重研究方


    数治理:支撑新代AI应落基石

    2016 年谷歌 AlphaGo 机器围棋赛中击败世界冠军李世石引爆工智开启工智新纪元2017年国务院发布实施新代工智发展规划中国面2030年工智产业进行整体规划部署时间工智AI成炙手热风口IT互联网企业推动互联网+数字化转型传统企业试图寻求助工智实现身转型升级

    年数先神化然妖魔化技术概念炒作路线样轮AI热潮必然会历度神化走落程狂热余必分析轮AI热潮实质:轮火热工智算法模型方面革命性重突破深度学早世纪八十年代已出现年工智突然爆发两关键素:数深度学算法提供海量训练数作支撑二高性计算尤通计算GPU予神网络深度学强计算力支持前法完成计算者法短时间完成计算成

    正两关键素作支撑轮工智呈现特征:特定领域学体真正变成机器工智正式进入20时代试图寻求助工智实现身转型升级传统企业关注焦点:助工智技术通机器学海量文视频图等数中天24时永停息探寻规模式预测趋势关联关系等隐性知识实现知识创新服务决策支持释放智红利公司获更早发展先机更强竞争力文关注重点非研究某项具体工智技术探讨传统企业部建立数知识套工作机制方法行业数+AI元素促成AI技术行业知识转化程中更发挥创新引领作

    1 数知识转化程

    文提出通数治理工作企业部建立起套支撑数深化应AI20(机器学)常态化运转涵盖数组织架构技术台等创新工作机制隐性知识转化体逐渐机器转变图示

    企业数包括社交媒体数机器机器数体量交易数生物计量学数工生成数分文视频图语音等承载形态数知识转化分两阶段:

    数深化应阶段企业数科学家数分析师等数专业员运机器学探索分析实时数服务等数深化应技术数中提取出规趋势关联关系等类知识基相关应方结合实际需求构建应场景产生业务价值阶段特征学体数专业员全程掌控基身验获取需类数选择合适算法技术工具台发掘隐含数中隐性知识完全离开

    新代工智应阶段数科学家数分析师等数专业员利种深度学算法放弃结果解释性限定问题假设训练样工标记数集追求学效性仅结合类先验常识隐性直觉等知识引导基海量数整体围绕机器学体目标建立注意力模型记忆网络迁移学强化学半监督监督学等算法模型实现浅层计算深度神推理永停息驱动学发掘隐含数中隐性知识终机器身具备数收集整理分析力算法进行调整优化数转变知识实现高阶工智更支撑知识创新服务级决策

    2 数治理

    更支撑数知识转化程应传统数治理升级数治理数数样数治理质数治理数治理方法样适数治理考虑数特性需作出适调整文重点阐述数治理传统数治理差异性较容数治理深化数应支撑新代工智落基石作

    通数治理推动学体数深化应阶段逐步机器学体新代工智应阶段转变推进治理数类型传统占15结构化数原生态格式结构占超85非结构化数转变推进治理数范围专注企业部数行业游跨行业社会舆情等数转变推进数治理工作目标体现间接价值直接推动价值创造转变

    21 数治理组织

    现数治理组织架构中增加数治理相关职责角色:数科学家AI算法专家等数专家纳入决策层——数治理委员会(知识创新领导组名字限)数专家驱动数知识转化视角知识指导实践洞察视角辅助作出种决策助组织高阶层面驱动数转化知识争取更资源数类型分设数[1]负责类型数收集(限公司)部提供外部交换质量安全等理工作数业务部门汇报专业性负责提升数资产信度隐私性时确保开展数深化应深化学时项保障工作支撑位

    22 数质量理

    数质量理相传统数质量理更加复杂表现数源复杂样性组织外数含义存差异性外部数难效控制质量错误数法溯源等等时机器学深度学算法数质量求极高否会导致机器法学产生错误知识影响决策造成资源浪费数质量评估维度需重新定义目前数质量度量性方面麻省理工学院Richard YWang等提出数质量度量维度典型代表数质量维度分四类19维度[2]表示:

    23 数架构理

    前型企业已启动完成数台建设基规划企业数架构重复处强调三点:

    需建立面源异构数尤非结构化数动采集机制数源合作企业热点网站需针类型数定制化开发采集程序包装器抽取程序等

    二文图视频等非结构化数必须员组织产品等数进行关联通索引分析等技术挖掘非结构化数潜价值

    三数架构应逐渐机器学体目标架构阶段性演进传统数仓库建设方法类似前期根应需求选择知识图谱智机器等应方基特定领域设计应场景逐步建立起针外部数动采集整合分析动学优化算法力通场景驱动逐渐推动数应架构数智化架构演进

    24 数生命周期理

    数生命周期理传统数生命周期理流程较相似数环境数清理传统数清理区较传统数言数质量重特性数数性更重传统意义垃圾数变废宝性数应建立数质量标准应财务统计数应分析数质量标准需求注重数全面性质量求特高需求审计风险严格关注垃圾数中发现问题数应中建议直接清理垃圾数通数质量分级质量等级数满足层次应需求

    25 数服务创新

    数治理数治理区两者关注点数治理保证数够反映原真实业务促进数业务致性企业基真实数环境更开展项业务活动产生间接价值数治理更关注发挥数应价值通数深化应深度学算法模型发掘隐藏海量数中规模式关系等知识指导业务部门开展领先市场竞争手高价值低风险业务活动通支撑新产业新业态跨界深度融合甚企业开辟全新市场空白带促进公司业务全面创新高速发展

    3总结

    文数视角新代工智定位相数深化应更高阶段知识提取程指出两者明确区:学体数深化应阶段机器学体新代工智应阶段两者处数知识转化程数转化知识程中应场景驱动通数治理项业务活动促进数工智技术深度融合释放智红利推动新代工智应逐渐落

    引:

    [1]桑尼尔索雷斯 数治理[M] 匡斌译 北京:清华学出版社2014

    [2]张绍华潘蓉宗宇伟 数治理服务 海科学技术出版社2016

    作者简介

    杨科学御数坊高级咨询顾问2006年硕士毕业中南学计算机专业获数理专业认证(CDMP)信息系统项目理师认证事数治理数标准数质量数模型设计等咨询设计工作先金融电力等行业家型企业提供数治理咨询企业数模型设计服务工作






    文档香网(httpswwwxiangdangnet)户传

    《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
    该内容是文档的文本内容,更好的格式请下载文档

    下载文档到电脑,查找使用更方便

    文档的实际排版效果,会与网站的显示效果略有不同!!

    需要 6 香币 [ 分享文档获得香币 ]

    下载文档

    相关文档

    如何看懂电路图

    如何看懂电路图2--电源电路单元前 面介绍了电路图中的元器件的作用和符号。一张电路图通常有几十乃至几百个元器件,它们的连线纵横交叉,形式变化多端,初学者往往不知道该从什么地方开始, 怎样才能读...

    12年前   
    528    0

    如何看懂电路图(超级完整版)

    电子设备中有各种各样的图。能够说明它们工作原理的是电原理图,简称电路图。电路图有两种,一种是说明模拟电子电路工作原理的。它用各种图形符号表示电阻器、电容器、开关、晶体管等实物,用线条把元器件和单...

    4年前   
    463    0

    一张蓝图干到底

    一张蓝图干到底  一个自然条件并不优越的小山村,10年间,农民人均收入翻两番,比全县农民人均收入高出近千元……陕西省白河县大双乡兴隆村的巨变(据人民日报2003年8月16日五版报道),得益于几...

    12年前   
    800    0

    一张表看懂员工持股计划与股权激励的区别

    序号内容股票期权业绩股票限制性股票股票增值权虚拟股权员工持股计划具体操作层面1文件(1)上市公司股权激励管理办法;(2)股权激励有关事项备忘录1号、2号、3号;(3)关于个人股票期权所得征收个...

    9年前   
    595    0

    Dota地图AI命令

    AI命令:    在下列命令前键入 “-o“, “-c“ 或 “ c“作为前缀: (例。 “-oa“, “-ca“, “ ca“都是合法命令)    提示: XX 代表玩家代号 (1,2,...

    9年前   
    7468    0

    《ai ei ui》教学反思

    《ai ei ui》教学反思《ai ei ui》教学反思1   《ai ei ui》是拼音教学中学习复韵母的第一课,但同学大多在幼儿园时都已学过,所以我在本课的设计中,除了让同学读准音,订正...

    2年前   
    367    0

    《ai ei ui》教学设计

    《ai ei ui》教学设计《ai ei ui》教学设计1   【教学目标】   1、学会3个复韵母ai ei ui 。   2、能正确认读音节,会读拼音词。   3、会读复韵母...

    2年前   
    523    0

    国土资源“一张图”工程及动态综合监管平台建设构想

    近年来,通过“金土工程”和“一张图”工程的实施,盐都区在国土资源一张图建设在数据库建设和管理应用方面积累了丰富的经验,并根据管理工作的实际需要向数据大集中方面努力。“用好一张图、管好一方地”,以...

    5年前   
    1801    0

    10.ai、ei、ui2

    10.ai、ei、ui2  第二课时  教学目的:  1.学习声母与ai、ei、ui组成的音节,能准确地拼读音节。  2.能正确地书写由声母和ai、ei、ui组成的音节。  3.读好小儿歌。 ...

    6个月前   
    141    0

    9.ai ei ui(教案)

    9 ɑi ei ui【教学目标】 1. 正确认读复韵母 ɑi、ei、ui 和它们的四声,读准音,认清形。2. 正确拼读声母和 ɑi、ei、ui 组成的音节。了解复韵母的标调规则。能在四线格中正...

    5年前   
    4616    0

    3.11《我是一张纸》 教案

    我是一张纸(重难点创新教学方法设计)教学目标1、了解纸的来源,知道节约用纸的重要性。2、养成节约用纸的良好习惯。教学时间:1课时教学过程一、新课导入师:同学们,今天老师为你们带来了一位神秘的朋...

    2年前   
    822    0

    一张荷叶

    中班语言活动一张荷叶一、活动目标1.能较清楚地、有顺序地讲述小鸡使用荷叶的过程。2.感受编讲图片故事的乐趣。二、活动准备1.经验准备:幼儿已认识荷花、荷叶。2.材料准备:荷叶实物和荷叶图片、p...

    4年前   
    823    0

    一张纸条

    一张纸条故事发生在初三数学考场上。。。。。。 今天接到通知去初中部监考。我真有些忐忑不安,原因是初三老师们在我领试卷的时候,给我下了“毛毛雨”。这些老师说,这群孩子是群驴,天不怕,地不怕...

    2个月前   
    84    0

    《我是一张纸》教学设计

    部编人教版道德与法治第42页《我是一张纸》,通过“找一找”、“我从哪里来”、“我的苦与乐”三个板块介绍,使学生初步认识纸,了解纸的来源,懂得纸对于同学们的生活来说是很重要的,要让同学们养成节约用纸的习惯。

    4年前   
    3250    0

    3.11《 我是一张纸》 教案

    我是一张纸教学目标:1、通过活动使学生认识纸张用处大、来之不易,应该珍惜每一张纸。2、通过实践活动,让学生懂得要从身边做起,从自己做起,节约每一张纸,养成节约用纸的好习惯。3、了解节约用纸的方...

    2年前   
    907    0

    学生作文:幸福是一张纸

    幸福是一张纸 一张纸,在旁人看来,微不足道,没有任何特别之处,比最平常还平常。但是对于我来说,却蕴含着母亲对我的浓浓的一份爱与责任。 雷雨交加 “嘀”的一声,我腕上的手表显示到了六点,但...

    11年前   
    10893    0

    学生作文:一张老照片

    学生作文:一张老照片 意外发现的一张照片记录着我过往的回忆。     当我看着照片时,我想起了小学时的一位好朋友。 小学家长会时,爸爸拿着照相机给我偷偷的拍下了这张照片,我和刘华华在一起...

    14年前   
    16480    0

    企业领导如何看懂三张表

    财务知识辅导材料1 第一讲 企业领导如何看懂三张表 企业发展有三“宝” 文章尽在三大“表” 引:三表进“财”。财务报表包括资产负债表、利润表、现金流量表三大报表...

    10年前   
    21624    0

    看懂招聘写好求职信

    看懂招聘写好求职信第一篇:看懂招聘广告写好求职信看懂招聘广告写好求职信看到一条招聘广告,欲发求职信时,你应意识到,其他人也看到了这条招聘广告,同样会寄出简历求职信与你竞争。一般来说,招聘广告的...

    11年前   
    468    0

    「解决方案」AI课堂系统解决方案

    因材施教是教学中一项重要的教学方法和教学原则,在教学中根据不同学生的认知水平、学习能力以及自身素质,教师选择适合每个学生特点的学习方法来有针对性的教学,发挥学生的长处,弥补学生的不足,激发学生学...

    4年前   
    1831    0