1.AI基础知识

1.1 AI基础概念
|
|
AI的定义、简要发展历程(知道几次发展浪潮)、主要应用领域(如医疗、金融、交通等)。 |
|
目标: 听到“人工智能”能联想到其广泛应用。关键词: 自动化、智能化。 |
🤖 AI的定义与目标
人工智能 是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它旨在让机器能够像人类一样思考、学习、决策和解决问题。
通俗来讲,如果一台机器能够与人类对话而不能被辨别出其机器身份,那么我们就可以认为这台机器具有智能。这也就是著名的“图灵测试”所探讨的核心,当前我们接触到的人工智能系统,绝大多数都属于弱人工智能,它们专注于完成某个特定任务,但在其他方面能力有限
🛣️ AI的发展历程
人工智能作为一门学科,正式诞生于1956年的达特茅斯会议,约翰·麦卡锡在会上首次提出了“人工智能”这一术语。它的发展并非一帆风顺,经历了多次高潮与低谷
|
时间节点 |
核心事件与特征 |
代表性成果 |
|---|---|---|
|
20世纪50-70年代 |
诞生与早期探索:基于符号逻辑和推理规则。 |
达特茅斯会议确立AI概念;ELIZA聊天机器人出现 。 |
|
20世纪80年代 |
专家系统兴起:依靠专家知识和规则库解决特定领域问题。 |
医疗诊断、化学分析等领域的专家系统 。 |
|
20世纪90年代-21世纪初 |
互联网与数据驱动:随着计算能力提升和互联网普及,机器学习方法得到重视。 |
IBM“深蓝”战胜国际象棋世界冠军;互联网搜索引擎发展 。 |
|
2012年至今 |
深度学习与大模型时代:神经网络技术取得突破,大数据和强大算力推动AI飞速发展。 |
AlphaGo战胜围棋冠军;生成式AI和大模型爆发 。 |
💡 AI的应用领域
智能制造:AI助力建设智能工厂,通过智能调度、质量控制和预测性维护,极大提升了生产效率和产品质量
。
医疗健康:AI辅助诊断系统能够帮助医生提高疾病诊断的准确率和效率,特别是在医学影像分析方面表现出色
。AI还能加速新药研发的进程。
交通运输:智能网联汽车和自动驾驶技术正在重塑未来的交通模式,旨在提升运行安全和效率
。
金融服务:机器学习算法广泛应用于风险评估、欺诈检测和智能投顾等领域,让金融服务更加精准和高效
。
日常生活:从智能手机上的语音助手、个性化的内容推荐,到智能家居控制系统,AI无处不在,持续改善着我们的生活体验
。
1.2 AI技术领域(重点)
|
技术领域 |
核心目标 |
关键技术与方法 |
典型应用场景 |
|---|---|---|---|
|
计算机视觉 (CV) |
让计算机能“看”懂图像和视频,识别、跟踪、测量并理解其中的内容 。 |
图像增强、边缘锐化、图像分割、特征抽取、卷积神经网络(CNN)、目标检测、语义分割 。 |
人脸识别、智能视频监控、医疗影像分析(如乳腺癌筛查)、自动驾驶汽车、工业质检 。 |
|
自然语言处理 (NLP) |
让计算机能理解、解释和生成人类语言,实现人机有效沟通 。 |
词嵌入(Word2Vec)、句法分析、语义分析、Transformer模型、大语言模型(如GPT、BERT) 。 |
机器翻译、智能客服聊天机器人、情感分析、文本自动摘要、信息检索 。 |
|
语音技术 (ASR/TTS) |
让机器能“听”懂语音(语音识别,ASR)并“说”出语言(语音合成,TTS) 。 |
隐马尔可夫模型(HMM)、深度学习(如DNN-HMM混合模型)、声学模型、语言模型 。 |
语音输入法、智能语音助手(如Siri)、实时语音转文字、呼叫中心语音分析 。 |
1.2.1 计算机视觉(CV)
计算机视觉旨在让机器具备类似人类视觉系统的能力,能够从图像或视频中提取信息并理解其内容
核心原理与技术:其技术流程常借鉴人类视觉皮层的处理方式,即一个从低级特征到高级语义的逐层抽象过程:
简单来说,计算机先处理像素,提取边缘、角点等基本特征;然后组合这些特征识别出轮廓、形状;最终在更高层次上理解这是什么物体或场景。卷积神经网络(CNN)是实现这一过程的强大工具,其中的卷积层负责提取特征,池化层用于降维和保持特征稳定性。此外,还包括目标检测(框出图像中多个物体并识别)和语义分割(对图像中的每个像素进行分类)等重要任务。
应用实例:CV的应用非常广泛。在医疗领域,它可以分析医学影像,辅助医生更早、更准确地发现病灶,例如在乳腺癌筛查中,CV系统已表现出媲美甚至超越人类放射科医生的能力
在自动驾驶中,CV是感知环境的核心,用于识别道路、车辆、行人及交通标志。在零售业,它被用于分析顾客在店内的行为轨迹,优化商品陈列和营销策略
1.2.2 自然语言处理(NLP)
自然语言处理是人工智能中研究机器理解、处理和生成人类语言的领域,旨在搭建人机之间的语言桥梁
核心原理与技术:NLP的技术发展经历了从基于规则的方法到统计学习方法,再到当前以深度学习(特别是Transformer架构)为主流的阶段。处理文本时,通常先进行预处理,包括分词、词性标注等。由于计算机无法直接理解文字,需要将词汇转化为数值向量(即词嵌入),从而捕捉词语的语义信息。之后会进行句法分析(理解句子结构)和语义分析(理解深层含义)。大语言模型(如GPT系列)的出现,通过海量数据预训练,让机器在语言理解和生成方面取得了飞跃性进展。
应用实例:NLP的应用几乎无处不在。机器翻译(如中英文互译)是最早也是最常见的应用
智能客服和聊天机器人(如你手机里的语音助手或网站客服)依赖NLP来理解你的问题并生成回答。情感分析可以自动分析社交媒体上的用户评论,判断舆论倾向。此外,还有文本自动摘要、信息检索(搜索引擎)等。
1.2.3 语音技术(ASR/TTS)
语音技术主要包含自动语音识别(ASR)和文本转语音(TTS),让机器具备“听”和“说”的能力
核心原理与技术:ASR的目标是将语音信号转换为对应的文本或指令其发展也从早期模板匹配,到隐马尔可夫模型(HMM),再到现在的深度神经网络(DNN) 与HMM相结合的混合模型。这个过程通常包括对语音信号的预处理、特征提取,然后通过声学模型和语言模型共同作用,最终解码出最可能的文本序列。TTS(语音合成) 则是一个相反的过程,它将文本信息转换成自然流畅的语音输出。
应用实例:最常见的应用就是手机上的语音输入法和智能语音助手(如Siri、小爱同学),它们能响应你的语音命令,在客户服务中心,ASR可用于将通话内容实时转写为文字,以便进行质量监控或关键词分析。TTS技术则广泛应用于无障碍工具(为视障人士朗读屏幕内容)、智能导航播报以及各类有声内容生成
1.3 AI前沿技术场景
1.4 大模型基础知识
2.AI算法
|
技术领域 |
核心目标 |
关键特征 |
典型算法/模型 |
主要应用场景 |
|---|---|---|---|---|
|
机器学习 |
让计算机从数据中学习规律,并基于此进行预测或决策 。 |
依赖数据驱动,需要从数据中提取特征或模式。 |
决策树、支持向量机、K近邻、逻辑回归 。 |
垃圾邮件过滤、房价预测、客户分群、推荐系统 。 |
|
深度学习 |
通过多层神经网络学习数据的内在规律和表示层次,实现更复杂的模式识别 。 |
使用多层神经网络结构,能够自动学习数据的层次化特征。 |
卷积神经网络、循环神经网络 。 |
图像识别、自然语言处理、语音识别、自动驾驶 。 |
2.1 机器学习(ML)
2.1.1 学习方式:监督 vs 无监督
这是机器学习中最基本的分类方式,理解它们的区别至关重要。
监督学习:好比有答案和解析的习题集。你提供给算法的训练数据不仅包含题目(特征),还包含正确答案(标签)。算法的任务就是学习题目和答案之间的映射关系,从而在面对新题目时能给出正确答案。它主要用于预测和分类
典型任务:分类(如图片中是猫还是狗)、回归(如预测房价)。
常见算法:线性回归、逻辑回归、决策树、支持向量机[SVM]。
无监督学习:则像一本没有答案的习题集。你只给算法数据,不告诉它任何标签或结果。算法的任务是自行发现数据内在的结构、模式或分组
典型任务:聚类(如将新闻文章按主题自动分组)、降维。
常见算法:K均值聚类、主成分分析
比喻记忆:监督学习是“有答案的学习”,无监督学习是“没有答案的自学”
2.1.2 常见问题:过拟合与欠拟合
在训练模型时,我们最希望看到的是模型既能学好训练数据,又能很好地适应新数据(即泛化能力强)。过拟合和欠拟合是两个需要避免的极端情况。
欠拟合:好比一个学生没学会知识点。模型过于简单,连训练数据本身的规律都没学好,导致在训练集和测试集上表现都很差
原因:模型太简单,特征不足
解决:增加特征、使用更复杂的模型、增加训练迭代次数
过拟合:好比一个学生死记硬背了所有习题和答案,但没有理解背后的原理。模型过于复杂,对训练数据学得“太好”,甚至记住了噪声和细节,导致在训练集上表现极好,但在未见过的测试集上表现很差
原因:模型太复杂,训练数据量不足或有噪声
解决:收集更多数据、清洗数据、进行正则化、简化模型(如减少特征)
比喻记忆:欠拟合是“没学会”,过拟合是“死记硬背”
2.2 深度学习
深度学习是机器学习的一个子领域,它通过模拟人脑神经网络的多层结构来学习数据的层次化特征表示
2.2.1 卷积神经网络:“看图专家”(CNN)
CNN是专门为处理网格状数据(如图像、视频)而设计的网络
工作原理:通过卷积核在图像上滑动,像一个小窗口一样逐块提取局部特征(如边缘、角点),然后层层传递和组合,最终形成对整体图像(如眼睛、鼻子、整张脸)的理解
典型应用:图像识别、人脸识别、自动驾驶中的物体检测。
比喻记忆:CNN是“看图专家”,擅长处理图像这类空间数据
2.2.2 循环神经网络:“记忆高手”(RNN)
RNN是为处理序列数据(如文本、语音、时间序列)而设计的网络,其特点是具有“记忆”能力
工作原理:RNN在处理序列中的每一个元素时,都会考虑之前处理过的信息,将前面的“记忆”带入当前的计算。这使得它能够理解上下文关系,比如预测一句话中的下一个词是什么
典型应用:语音识别、机器翻译、文本生成
比喻记忆:RNN是“记忆高手”,擅长处理有时序关系的序列数据
验收习题
一、单选题
【概念辨析】 一家公司想开发一个系统,用于自动识别生产线上的产品瑕疵。这个任务主要涉及哪个AI技术领域?
A. 自然语言处理(NLP)
B. 计算机视觉(CV)
C. 语音识别(ASR)
D. 强化学习
【概念理解】 我们通过精心设计问题和指令来引导大模型生成更准确答案的过程,被称为?
A. 模型训练
B. 提示工程
C. 数据清洗
D. 梯度下降
【关键区别】 在机器学习中,我们有一组包含房价和房屋面积的数据,希望训练一个模型来预测新房屋的价格。这属于哪类学习问题?
A. 非监督学习
B. 监督学习
C. 强化学习
D. 深度学习
【关键区别】 一个图像识别模型在训练集上准确率达到99%,但在测试集上只有60%。这很可能出现了什么情况?
A. 欠拟合
B. 过拟合
C. 梯度消失
D. 数据平衡
【模型应用】 以下哪个AI模型最适用于处理像“天气预报”这样与时间序列强相关的数据?
A. 卷积神经网络(CNN)
B. 循环神经网络(RNN)
C. 生成对抗网络(GAN)
D. 支持向量机(SVM)
【概念理解】 在深度学习中,用于衡量模型预测值与真实值之间差距的函数是?
A. 激活函数
B. 优化器
C. 损失函数
D. 卷积函数
人工智能(AI)的核心目标是?
A. 制造出外观与人类完全一致的机器人
B. 让机器具备模拟、延伸和扩展人的智能的能力
C. 开发能快速执行复杂数学计算的程序
D. 实现机器的自我意识和情感
答案:B
解析: AI的核心是研究和开发用于模拟、延伸和扩展人的智能的理论、方法及应用系统,而非仅关注外观、计算能力或实现意识。
以下哪一项不属于人工智能的主要研究领域?
A. 自然语言处理(NLP)
B. 计算机视觉(CV)
C. 数据库管理
D. 机器学习(ML)
答案:C
解析: 数据库管理主要涉及数据的存储、组织和检索,是计算机科学的基础领域,并非AI的核心研究方向。
在机器学习中,“监督学习”和“无监督学习”最根本的区别在于?
A. 模型的学习效率不同
B. 训练数据是否带有标签
C. 模型的复杂程度不同
D. 适用的计算资源不同
答案:B
解析: 监督学习使用带有标签的数据进行训练,目标是学习从输入到输出的映射关系;无监督学习则处理无标签数据,旨在发现数据内在的结构或模式。
卷积神经网络(CNN)最擅长处理哪类数据?
A. 时间序列数据,如股票价格
B. 文本数据,如新闻文章
C. 网格状数据,如图像
D. 表格数据,如Excel表格
答案:C
解析: CNN通过其卷积层和池化层等结构,能非常有效地提取图像等网格化数据的空间特征(如边缘、纹理)。
在AI伦理中,“算法偏见”主要指的是什么风险?
A. 算法运行速度过慢
B. 训练数据中存在对特定群体的系统性偏差,导致模型决策不公
C. 算法过于复杂难以理解和解释
D. 算法容易被恶意攻击
答案:B
解析: 算法偏见通常源于训练数据本身包含的历史性或社会性偏差,导致AI系统的决策对某些群体产生不公平的影响。
二、判断题
判断下列说法是否正确,考察你对关键细节和常见误区的辨别能力。
人工智能就是让计算机像人类一样思考和行动。( √ )
解析: 这是人工智能的终极目标和研究方向之一,尽管目前尚未完全实现。
深度学习是人工智能的唯一方法。( × )
解析: 深度学习是人工智能的一个重要分支和强大工具,但并非唯一方法。还有基于规则的专家系统、遗传算法等多种技术路径。
过拟合是指模型在训练集上表现很好,但在未见过的测试集上表现较差的现象。( √ )
解析: 过拟合的本质是模型过度学习了训练数据中的细节和噪声,导致泛化能力下降。
自然语言处理(NLP)只处理文本数据。( × )
解析: NLP也处理与语言相关的语音数据,例如语音识别(将语音转为文本)和语音合成(将文本转为语音)。
三、简答题
检验你组织语言、系统阐述知识点的能力。
请简要说明监督学习和无监督学习的主要区别,并各举一个典型应用例子。
答案要点:
核心区别: 监督学习使用有标签的数据进行训练,无监督学习使用无标签的数据。
监督学习例子: 垃圾邮件分类(数据有“垃圾邮件”或“正常邮件”的标签)。
无监督学习例子: 客户分群/聚类分析(将无标签的客户数据根据消费行为等特征自动分成不同的组)。
什么是“过拟合”?列举一种防止或减轻过拟合的常用方法。
答案要点:
过拟合: 模型过度学习了训练数据集中的特定模式(包括噪声),导致其在训练集上表现优异,但在新数据(测试集)上表现不佳,泛化能力差。
解决方法(任选其一即可):
交叉验证: 将训练集再分为更小的训练集和验证集,用于评估模型并调整参数。
正则化: 在损失函数中加入惩罚项,限制模型参数的大小,防止模型过于复杂。
增加数据量: 提供更多、更多样化的训练数据。
早停: 在验证集性能开始下降时停止训练。
总结:
AI基础概念
人工智能的核心目标是让机器能够模拟、延伸和扩展人的智能,执行诸如学习、推理、感知、决策等任务
。它被视为一种通用目的技术,这意味着它会像过去的铁路、电力一样,渗透到几乎所有行业,深刻改变社会。
AI的发展并非一帆风顺,共经历了两次发展浪潮和所谓的“冬天”,其主要原因是社会期望一度超越了当时ICT产业的实际工程水平
。如今,我们正处在AI收获成果的季节,其标志是算力、算法和数据的巨大进步。
AI三大技术领域
你需要清晰掌握以下三个核心领域的区别,这是高频考点:
计算机视觉:让机器“看懂”图像和视频。其应用包括人脸识别、医疗影像分析和工业质检
。
自然语言处理:让机器“理解”和生成人类语言。典型应用有智能客服、机器翻译和情感分析
。
语音技术:让机器“听懂”和“说出”人话。它包含自动语音识别(将语音转为文字)和文本转语音技术,广泛应用于语音输入法和智能语音助手
。
AI算法核心:机器学习与深度学习
机器学习是让计算机从数据中学习规律的方法。你需要重点理解两种学习方式:
监督学习:数据集包含“标准答案”,常用于预测和分类。
无监督学习:数据集无标签,旨在发现数据内在结构。
在模型训练中,要警惕过拟合和欠拟合。你可以将过拟合理解为“死记硬背”,将欠拟合理解为“没学会”。
深度学习是机器学习的一个分支,它通过构建深层神经网络来学习数据的高层特征。你需要掌握两种经典网络:
卷积神经网络:专为处理图像等网格化数据设计,是“看图专家”
。
循环神经网络:擅长处理语音、文本等序列数据,具有“记忆”功能
🔄 提示工程 vs. 模型微调
特性
提示工程
模型微调
核心思想
引导与沟通:通过优化输入指令来激发模型现有潜力。
训练与适配:通过额外训练调整模型内部参数,使其适配特定任务或领域。
资源需求
相对较低,主要依赖设计技巧和迭代尝试。
较高,需要准备标注数据、消耗大量算力进行再训练。
灵活性
高,可快速适配多种不同任务,无需动模型本身。
较低,一次微调通常针对一个特定任务,改动成本高。
主要目标
在少样本或零样本场景下快速获得较好效果,充分发挥基础模型通用能力。
让模型在特定领域或任务上达到最优性能,使其更“专业化”。
提示工程像是“因材施教”的教学方法,而微调则是为特定岗位进行“专业培训
3.华为AI开发平台
|
知识点(考纲原文) |
需要掌握的具体内容(选择题深度) |
学习要点与记忆技巧 |
|---|---|---|
|
① 华为AI全栈全场景整体应用 |
核心组件: |
核心记忆口诀: |
|
② 华为云AI开发平台使用 |
核心流程: 了解在ModelArts上完成一个AI项目的基本步骤: |
比喻记忆: 把ModelArts想象成一个AI厨房:数据是食材,训练是炒菜,部署是把菜端上桌。 |
🔧 角色与关系:ModelArts 与 MindSpore
|
组件 |
角色定位 |
与另一组件的关系 |
|---|---|---|
|
ModelArts |
一站式AI开发平台(工作台):提供从数据到部署的全生命周期管理服务,集成了算力、数据、算法等各种资源,让开发者能够聚焦AI应用本身 。 |
ModelArts 是承载和运行 MindSpore 的平台。在 ModelArts 上,开发者可以选择使用 MindSpore 作为其深度学习框架 。 |
|
MindSpore |
AI计算框架(核心工具):是一个用于定义、训练和运行深度学习模型的基础软件库,类似于TensorFlow或PyTorch 。它提供了构建神经网络所需的各类组件(如张量操作、自动微分等)。 |
MindSpore 是 ModelArts 平台支持的核心工具之一。开发者利用 MindSpore 在 ModelArts 这个平台上编写和执行AI算法 。 |
一个简单的比喻是:如果将AI开发比作烹饪,ModelArts就是一个功能齐全的现代化厨房,提供了灶具、水源、储物空间等基础设施;而MindSpore则是厨房里一套高性能的刀具和锅具,是厨师(开发者)直接用于烹饪(模型开发)的核心工具。
3.1 华为AI全栈全场景整体应用
🏗️ 华为AI全栈全场景解析
全栈:这指的是技术上覆盖了所有层面,包括:
Ascend系列AI芯片:为AI计算提供强大的算力基础,是解决方案的硬件核心。
CANN:芯片算子库和高度自动化算子开发工具,是连接芯片与上层框架的桥梁。
MindSpore:支持端、边、云独立与协同的统一训练和推理框架。
应用使能与开发平台(如ModelArts):提供全流程服务、分层API和预集成方案,降低开发门槛。
全场景:这意味着解决方案可以部署在各种环境中,包括公有云、私有云、边缘计算节点以及物联网终端和消费类终端,实现智能的全面覆盖。
这个体系的目标是实现普惠AI,让AI“用得起、用得好、用得放心”。
3.2 华为云AI开发平台使用
⚙️ ModelArts平台核心使用流程

数据准备与标注:这是AI开发的基石。你需要将准备好的数据上传到平台,并对数据进行标注以指导模型学习。例如,在图像识别项目中,需要标注出图片中的特定物体。平台也提供自动学习功能,尝试从已标注的数据中自动进行特征提取,甚至能推荐数据标注标签,以提升数据准备的效率。
模型训练:在这个阶段,平台利用标注好的数据来“教会”模型如何完成任务。你可以选择适合的算法,配置相关参数,ModelArts会调用底层的昇腾AI芯片等算力资源进行大规模分布式训练。训练完成后,平台会自动生成模型。
模型部署与应用:训练好的模型需要部署为可调用的服务才能产生实际价值。ModelArts支持将模型一键部署为在线服务,并提供一个API端点。之后,开发者就可以通过集成开发环境(如CodeArts IDE)编写代码,调用这个API,将AI能力集成到自己的应用程序中。
记忆卡片:
昇腾、Atlas、ModelArts 的关系:可以这样理解:昇腾是强大的“发动机”(芯片),Atlas是将发动机组装成的各种“车型”(AI计算平台),而ModelArts是设施完备的“汽车制造与改装厂”(开发平台)。
记忆口诀:“芯片(Ascend)是根基,平台(ModelArts)是工具,解决方案(Atlas)是成品。”
4.AI开发框架
|
知识点(考纲原文) |
需要掌握的具体内容(选择题深度) |
学习要点与记忆技巧 |
|---|---|---|
|
① AI开发框架介绍 |
核心定义: MindSpore是华为自研的全场景AI计算框架。它的定位类似于TensorFlow、PyTorch,是用于构建和训练深度学习模型的工具。 |
定位记忆: 明确框架(MindSpore)和平台(ModelArts)的关系。ModelArts是“工作台”,MindSpore是工作台上的“核心工具之一”。 |
|
② MindSpore基础知识和使用 |
核心概念: |
概念理解: 张量是AI框架里表示数据的通用方式,比如一张图片就可以表示为一个三维张量(高度、宽度、颜色通道)。 |
为了帮助您系统性地掌握华为的AI开发框架MindSpore,我为您梳理了它的核心定位、关键概念和学习路径。下面的表格汇总了MindSpore的主要信息,方便您快速建立整体印象。
|
特性维度 |
说明 |
|---|---|
|
核心定位 |
华为自研的全场景AI计算框架,定位类似于TensorFlow、PyTorch,是用于构建和训练深度学习模型的工具 。 |
|
设计目标 |
易开发、高效执行、全场景覆盖(支持端、边、云等各种设备) 。 |
|
核心数据结构 |
张量(Tensor),可理解为多维数组,是MindSpore中表示数据的基础单位 。 |
|
基本开发流程 |
数据准备 → 网络构建(定义模型) → 模型训练 → 模型评估与部署 。 |
|
与ModelArts关系 |
ModelArts是一站式AI开发平台(工作台),MindSpore是其支持的核心深度学习框架(工具 |
4.1 AI开发框架
AI开发框架:它就像建筑师的设计软件和标准化工具集。在没有这些工具的时代,建筑师需要从零开始手工绘制每一根线条,计算每一处承重,效率低且容易出错。而现代设计软件提供了预先定义好的墙、柱、梁等构件,以及强大的计算和渲染引擎,让建筑师能专注于创意和整体设计,大幅提升了效率和质量。
类似的,AI开发框架(如MindSpore、TensorFlow、PyTorch)为开发者提供了构建AI模型所需的基础构件(如各种神经网络层、激活函数)和自动化工具(如自动求导、优化算法),让开发者无需从零开始编写复杂的数学运算,能更专注于模型结构的设计和业务逻辑的实现。
4.2 MindSpore开发流程
4.2.1 张量:数据的基础表示
张量 是MindSpore,也是大多数AI框架中表示数据的基本单位。您可以把它理解为多维数组,它是标量、向量和矩阵的高维扩展。
标量:0维张量,表示一个单独的数字。
向量:1维张量,表示一组有序的数字。
矩阵:2维张量,表示一个二维数组。
高阶张量:3维及以上的张量。例如,一张彩色图片在计算机中通常就是一个3维张量,其维度表示(高度,宽度,颜色通道)
。
4.2.2 开发流程
数据准备与加载:使用
模块提供的高效数据工具读取和预处理数据,例如图片归一化、数据增强等。
mindspore.dataset网络构建(定义模型):通过继承
类来定义你的神经网络模型。在
nn.Cell方法中定义网络层(如全连接层
__init__,卷积层
nn.Dense),在
nn.Conv2d方法中定义数据的前向传播逻辑。
construct模型训练:
定义损失函数(如
)。
nn.SoftmaxCrossEntropyWithLogits选择优化器(如
)来更新模型参数。
nn.Momentum使用
接口封装网络、损失函数和优化器,然后调用
Model方法进行训练。
train模型评估与部署:训练完成后,使用测试集评估模型性能,最终将模型部署到实际应用环境中。
习题验收:
单选题
以下关于华为AI开发平台ModelArts的说法,错误的是?
A. 支持多种深度学习框架
B. 仅适用于华为内部开发人员
C. 提供可视化开发界面
D. 可以实现模型的训练和部署
答案:B。ModelArts是面向广大开发者的开放平台,并非仅限内部使用
华为AI计算集群的管理系统是?
A. FusionDirector
B. ModelArts
C. MindSpore
D. AscendCANN
答案:A。FusionDirector是专门的管理系统,而ModelArts是开发平台,MindSpore是框架
以下关于华为MindSpore深度学习框架的说法,正确的是?
A. 仅支持Python语言
B. 不支持分布式训练
C. 具有自动微分功能
D. 不能与昇腾芯片协同工作
答案:C。自动微分是MindSpore的核心功能之一,它支持多种语言和分布式训练,并能与昇腾芯片协同工作
。
在华为AI解决方案中,用于边缘计算场景的芯片主要是?
A. 昇腾910
B. 昇腾310
C. Atlas 800
D. 麒麟9000
答案:B。昇腾310芯片专为边缘计算场景设计,注重低功耗和实时性
多选题
华为人工智能技术体系包括以下哪些层次?
A. 基础层
B. 技术层
C. 应用层
D. 管理层
答案:A B C。华为AI技术体系主要包含提供算力资源的基础层、提供算法模型的技术层以及实现行业落地的应用层
华为AI开发平台ModelArts的核心功能包括?
A. 数据管理
B. 模型训练
C. 模型部署
D. 自动机器学习
答案:A B C D。ModelArts提供从数据准备、模型训练、部署到自动化机器学习(AutoML)的端到端功能
以下属于深度学习框架的有?
A. TensorFlow
B. PyTorch
C. MindSpore
D. Scikit-learn
答案:A B C。Scikit-learn是一个传统的机器学习库,并非为深度学习设计
判断题
华为自研的Ascend芯片是专门用于人工智能计算的芯片。
A. True
B. False
答案:A。昇腾(Ascend)系列是华为专为AI计算设计的处理器(NPU)
“数据、算法、算力、场景”并称为人工智能的四要素。
A. True
B. False
答案:A。这四项是构成AI技术和应用落地的四个核心基础要素
















暂无评论内容