DSP

CKS32F4xx系列使用高性能的32位内核,支持浮点运算单元（FPU），同时还支持DSP指令以及存储保护（MPU）用来加强应用的安全性。

DSP介绍

CKS32F4xx系列拥有两个DSP指令：MAC指令（32位乘法累加）和SIMD指令。32位乘法累加（MAC）单元包括新的指令集，能够在单周期内完成一个32×32+64→64的操作或两个16×16的操作。而SIMD指令与硬件乘法器一起工作（MAC），使所有这些指令都能在单个周期内执行。受益于SIMD指令的支持，CKS32F4xx系列能在单周期内完成高达32×32+64→64的运算，为其他任务释放处理器的带宽，而不是被乘法和加法消耗运算资源。

DSP源码库具有以下功能：

BasicMathFunctions

提供浮点数的各种基本运算函数，如向量加减乘除等运算。

CommonTables

arm_common_tables.c文件提供位翻转或相关参数表。

ComplexMathFunctions

复杂数学功能，如向量处理，求模运算的。

ControllerFunctions

控制功能函数。包括正弦余弦，PID电机控制，矢量Clarke变换，矢量Clarke逆变换等。

FastMathFunctions

快速数学功能函数。提供了一种快速的近似正弦，余弦和平方根等，相比CMSIS计算库要快的数学函数。

FilteringFunctions

滤波函数功能，主要为FIR和LMS（最小均方根）等滤波函数。

MatrixFunctions

矩阵处理函数。包括矩阵加法、矩阵初始化、矩阵反、矩阵乘法、矩阵规模、矩阵减法、矩阵转置等函数。

StatisticsFunctions

统计功能函数。如求平均值、最大值、最小值、计算均方根RMS、计算方差/标准差等。

SupportFunctions

支持功能函数，如数据拷贝，Q格式和浮点格式相互转换，Q任意格式相互转换。

TransformFunctions

变换功能。包括复数FFT（CFFT）/复数FFT逆运算（CIFFT）、实数FFT（RFFT）/实数FFT逆运算（RIFFT）、和DCT（离散余弦变换）和配套的初始化函数。

DSP库运行环境搭建

接下来我们讲解如何搭建DSP库运行环境，只要运行环境搭建好了，使用DSP库里面的函数来做相关处理就非常简单了。在MDK里面搭建CKS32F4xx系列的DSP运行环境(使用.lib方式)是很简单的，分为3个步骤：

1、添加文件

首先，我们在例程工程目录下新建DSP_LIB文件夹，存放我们将要添加的相关文件，如图1所示：

然后，打开工程，新建DSP_LIB分组，并将.lib文件添加到工程里面，如图2所示：

2、添加头文件包含路径

添加好.lib文件后，我们要添加头文件包含路径，将第一步拷贝的Include文件夹和DSP_LIB文件夹加入头文件包含路径，如图3所示：

3、添加全局宏定义

最后，为了使用DSP库的所有功能，我们还需要添加几个全局宏定义：

1，__FPU_USED

2，__FPU_PRESENT

3，ARM_MATH_CM4

4，__CC_ARM

5，ARM_MATH_MATRIX_CHECK

6，ARM_MATH_ROUNDING

添加方法：点击魔法棒→C/C++选项卡，然后在Define里面进行设置，如图4所示：

这里，两个宏之间用“,”隔开。并且，上面的全局宏里面，我们没有添加__FPU_USED，因为这个宏定义在Target选项卡设置Code Generation的时候选择了：Use FPU（如果没有设置Use FPU，则必须设置！！），故MDK会自动添加这个全局宏，因此不需要我们手动添加了。这样，在Define处要输入的所有宏为：

CKS32F40_41xxx,USE_STDPERIPH_DRIVER,ARM_MATH_CM4,__CC_ARM,ARM_MATH_MATRIX_CHECK,ARM_MATH_ROUNDING 共6个。

至此，CKS32F4xx系列的DSP库运行环境就搭建完成了。为了方便调试，本章例程我们将MDK的优化设置为-O0优化，以得到最好的调试效果。

DSP FFT测试

关于FFT这里就不再详细介绍。如果我们要自己实现FFT算法，对于不懂数字信号处理的人来说，是比较难的，不过，DSP库里面就有FFT函数给我们调用，因此我们只需要知道如何使用这些函数，就可以迅速的完成FFT计算。DSP库里面提供了定点和浮点 FFT 实现方式，并且有基4的也有基2的，大家可以根据需要自由选择实现方式。注意：对于基4的FFT输入点数必须是4n，而基2的FFT 输入点数则必须是2n，并且基4的FFT算法要比基2的快。本章我们将采用DSP库里面的基4浮点FFT算法来实现FFT变换，并计算每个点的模值，所用到的函数有：

FFT变换用到的函数

arm_status arm_cfft_radix4_init_f32( arm_cfft_radix4_instance_f32 * S, 
uint16_t fftLen,uint8_t ifftFlag,uint8_t bitReverseFlag)
void arm_cfft_radix4_f32(const arm_cfft_radix4_instance_f32 * S,float32_t * pSrc)
void arm_cmplx_mag_f32(float32_t * pSrc,float32_t * pDst,uint32_t numSamples)

arm_cfft_radix4_init_f32用于初始化FFT运算相关参数，其中：fftLen用于指定 FFT长度（16/64/256/1024/4096），本章设置为1024；ifftFlag用于指定是傅里叶变换(0)还是反傅里叶变换(1)，本章设置为0；bitReverseFlag用于设置是否按位取反，本章设置为1；最后，所有这些参数存储在一个 arm_cfft_radix4_instance_f32结构体指针S里面。

arm_cfft_radix4_f32就是执行基4浮点FFT运算的，pSrc传入采集到的输入信号数据（实部+虚部形式），同时FFT变换后的数据，也按顺序存放在pSrc里面，pSrc必须大于等于 2倍fftLen长度。另外，S结构体指针参数是先由arm_cfft_radix4_init_f32函数设置好，然后传入该函数的。

arm_cmplx_mag_f32用于计算复数模值，可以对FFT变换后的结果数据，执行取模操作。pSrc为复数输入数组（大小为 2*numSamples）指针，指向FFT变换后的结果；pDst 为输出数组（大小为 numSamples）指针，存储取模后的值；numSamples就是总共有多少个数据需要取模。

通过这三个函数，我们便可以完成 FFT 计算，并取模值。

主函数

int main(void)
{
    arm_cfft_radix4_instance_f32 scfft;
    float time;
    u8 buf[50];
    u16 i;
    NVIC_PriorityGroupConfig(NVIC_PriorityGroup_2);//设置系统中断优先级分组2
    delay_init(168);  //初始化延时函数
    Debug_USART_Config(); //初始化串口波特率为115200
    TIM3_Int_Init(65535,84-1); //1Mhz计数频率,最大计时65ms左右超出
    arm_cfft_radix4_init_f32(&scfft,FFT_LENGTH,0,1);//初始化scfft结构体，设定FFT相关参数  
    while(1)
    {
        for(i=0;i<fft_length;i++) 生成信号序列
        {
            fft_inputbuf[2*i]=100+10*arm_sin_f32(2*PI*i/FFT_LENGTH)+30*arm_sin_f32(2*PI*i*4/FFT_LENGTH)+50*arm_cos_f32(2*PI*i*8/FFT_LENGTH); //生成输入信号实部 
            fft_inputbuf[2*i+1]=0;//虚部全部为0
        }
        TIM_SetCounter(TIM3,0);//重设TIM3定时器的计数器值
        timeout=0;
        arm_cfft_radix4_f32(&scfft,fft_inputbuf); //FFT计算（基4）
        time=TIM_GetCounter(TIM3)+(u32)timeout*65536;
        sprintf((char*)buf,"%0.3fms\r\n",time/1000);
        printf("\r\nFFT基4运算运行时间为：\r\n%s", buf);
        arm_cmplx_mag_f32(fft_inputbuf,fft_outputbuf,FFT_LENGTH);
        printf("\r\n%d point FFT runtime:%0.3fms\r\n",FFT_LENGTH,time/1000);
        printf("FFT Result:\r\n");
        for(i=0;i<fft_length;i++)< span="">
        {
            printf("fft_outputbuf[%d]:%f\r\n",i,fft_outputbuf[i]);
        }
        delay_ms(2000);
        delay_ms(2000);
        delay_ms(2000);
    }
}

主函数里面通过我们前面介绍的三个函数：arm_cfft_radix4_init_f32、 arm_cfft_radix4_f32和arm_cmplx_mag_f32来执行FFT变换并取模值。每隔6秒就会重新生成一个输入信号序列，并执行一次FFT计算，将 arm_cfft_radix4_f32 所用时间统计出来，同时将取模后的模值通过串口打印出来。

来源：中科芯MCU

免责声明：本文为转载文章，转载此文目的在于传递更多信息，版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题，请联系小编进行处理（联系邮箱：cathy@eetrend.com）。

围观 12

本视频将向您介绍通用开发生态系统，使您能够在一个完整的平台设计中使用低功耗PIC24F MCU和强大的dsPIC33 DSC，并演示跨器件系列的轻松移植。您可以从我们的GitHub页面下载代码示例： https://github.com/microchip-pic-avr-examples/pic24f-dspic33c-easy-migration-demo

来源：Microchip
免责声明：本文为转载文章，转载此文目的在于传递更多信息，版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题，请联系小编进行处理（联系邮箱：cathy@eetrend.com）。

围观 15

首先，“嵌入式”这是个概念，准确的定义没有，各个书上都有各自的定义。但是主要思想是一样的，就是相比较PC机这种通用系统来说，嵌入式系统是个专用系统，结构精简，在硬件和软件上都只保留需要的部分，而将不需要的部分裁去。所以嵌入式系统一般都具有便携、低功耗、性能单一等特性。

然后，MCU、DSP、FPGA这些都属于嵌入式系统的范畴，是为了实现某一目的而使用的工具。

MCU俗称”单片机“经过这么多年的发展，早已不单单只有普林斯顿结构的51了，性能也已得到了很大的提升。因为MCU必须顺序执行程序，所以适于做控制，较多地应用于工业。而ARM本是一家专门设计MCU的公司，由于技术先进加上策略得当，这两年单片机市场份额占有率巨大。

ARM的单片机有很多种类，从低端M0(小家电)到高端A8、A9(手机、平板电脑)都很吃香，所以也不是ARM的单片机一定要上系统，关键看应用场合。

DSP叫做数字信号处理器，它的结构与MCU不同，加快了运算速度，突出了运算能力。可以把它看成一个超级快的MCU。低端的DSP，如C2000系列，主要是用在电机控制上，不过TI公司好像称其为DSC(数字信号控制器)一个介于MCU和DSP之间的东西。高端的DSP，如C5000/C6000系列，一般都是做视频图像处理和通信设备这些需要大量运算的地方。

FPGA叫做现场可编程逻辑阵列，本身没有什么功能，就像一张白纸，想要它有什么功能完全靠编程人员设计(它的所有过程都是硬件，包括VHDL和Verilog HDL程序设计也是硬件范畴，一般称之为编写“逻辑”。)。

如果你够NB，你可以把它变成MCU，也可以变成DSP。由于MCU和DSP的内部结构都是设计好的，所以只能通过软件编程来进行顺序处理，而FPGA则可以并行处理和顺序处理，所以比较而言速度最快。

那么为什么MCU、DSP和FPGA会同时存在呢?那是因为MCU、DSP的内部结构都是由IC设计人员精心设计的，在完成相同功能时功耗和价钱都比FPGA要低的多。而且FPGA的开发本身就比较复杂，完成相同功能耗费的人力财力也要多。

所以三者之间各有各的长处，各有各的用武之地。但是目前三者之间已经有融合的态势，ARM的M4系列里多加了一个精简的DSP核，TI的达芬奇系列本身就是ARM+DSP结构，ALTERA和XINLIX新推出的FPGA都包含了ARM的核在里面。所以三者之间的关系是越来越像三基色的三个圆了。

一言以蔽之“你中有我，我中有你”。

硬件工程师学习从何开始?

单片机:通常

dsp:用于复杂的计算，像离散余弦变换、快速傅里叶变换，常用于图像处理，在数码相机等设备中使用。

arm:一个英国的芯片设计公司，但是不生产芯片。只卖知识产权。

fpga:现场可编程门阵列，以硬件描述语言(Verilog 或 VHDL)所完成的电路设计，可以经过简单的综合与布局，快速的烧录至 FPGA 上进行测试，是现代 IC 设计验证的技术主流。

嵌入式是相对于台式电脑而言，系统可裁剪，形态各异，可能体积、功耗、成本受限、实时性要求高，如示波器，手机，平板电脑，全自动洗衣机，路由器、数码相机，这些设备中，虽然看不到台式机的存在，但是都有一个或多个嵌入式系统在工作。

根据对象体系的功能复杂性和计算处理复杂性，提供的不同选择。对于简单的家电控制嵌入式系统，采用简单的8位单片机就足够了，价廉物美，对于手机和游戏机等，就必须采用32位的ARM和DSP等芯片了。FPGA是一种更偏向硬件的实现方式。

所以要通过学习成为硬件工程师，要从单片机开始，然后学习ARM和DSP之类。

市面上七大主流单片机的详细介绍

单片机现在可谓是铺天盖地，种类繁多，让开发者们应接不暇，发展也是相当的迅速，从上世纪80年代，由当时的4位8位发展到现在的各种高速单片机。

各个厂商们也在速度、内存、功能上此起彼伏，参差不齐~~同时涌现出一大批拥有代表性单片机的厂商：Atmel、TI、ST、MicroChip、ARM…国内的宏晶STC单片机也是可圈可点…

下面为大家带来51、MSP430、TMS、STM32、PIC、AVR、STC单片机之间的优缺点比较及功能体现……

51单片机

应用最广泛的8位单片机当然也是初学者们最容易上手学习的单片机，最早由Intel推出，由于其典型的结构和完善的总线专用寄存器的集中管理，众多的逻辑位操作功能及面向控制的丰富的指令系统，堪称为一代“经典”，为以后的其它单片机的发展奠定了基础。

51单片机之所以成为经典，成为易上手的单片机主要有以下特点：

特性：

从内部的硬件到软件有一套完整的按位操作系统，称作位处理器，处理对象不是字或字节而是位。不但能对片内某些特殊功能寄存器的某位进行处理，如传送、置位、清零、测试等，还能进行位的逻辑运算，其功能十分完备，使用起来得心应手。
同时在片内RAM区间还特别开辟了一个双重功能的地址区间，使用极为灵活，这一功能无疑给使用者提供了极大的方便，
乘法和除法指令，这给编程也带来了便利。很多的八位单片机都不具备乘法功能，做乘法时还得编上一段子程序调用，十分不便

缺点：(虽然是经典但是缺点还是很明显的)

AD、EEPROM等功能需要靠扩展,增加了硬件和软件负担
虽然I/O脚使用简单，但高电平时无输出能力，这也是51系列单片机的最大软肋
运行速度过慢，特别是双数据指针，如能改进能给编程带来很大的便利
51保护能力很差，很容易烧坏芯片

应用范围：

目前在教学场合和对性能要求不高的场合大量被采用。

使用最多的器件：8051、80C51。

MSP430单片机

MSP430系列单片机是德州仪器1996年开始推向市场的一种16位超低功耗的混合信号处理器，给人们留下的最大的亮点是低功耗而且速度快,汇编语言用起来很灵活,寻址方式很多,指令很少,容易上手。

主要是由于其针对实际应用需求，把许多模拟电路、数字电路和微处理器集成在一个芯片上，以提供“单片”解决方案。其迅速发展和应用范围的不断扩大，主要取决于以下的特点…

特性：

强大的处理能力，采用了精简指令集(RISC)结构，具有丰富的寻址方式( 7 种源操作数寻址、 4 种目的操作数寻址)、简洁的 27 条内核指令以及大量的模拟指令;大量的寄存器以及片内数据存储器都可参加多种运算;还有高效的查表处理指令;有较高的处理速度，在 8MHz 晶体驱动下指令周期为 125 ns 。这些特点保证了可编制出高效率的源程序
在运算速度方面，能在 8MHz 晶体的驱动下，实现 125ns 的指令周期。16 位的数据宽度、 125ns 的指令周期以及多功能的硬件乘法器(能实现乘加)相配合，能实现数字信号处理的某些算法(如 FFT 等)。
超低功耗方面，MSP430 单片机之所以有超低的功耗，是因为其在降低芯片的电源电压及灵活而可控的运行时钟方面都有其独到之处。电源电压采用的是 1.8~3.6V 电压。因而可使其在 1MHz 的时钟条件下运行时，芯片的电流会在 200~400uA 左右，时钟关断模式的最低功耗只有 0.1uA

缺点：

个人感觉不容易上手，不适合初学者入门，资料也比较少，只能跑官网去找
占的指令空间较大,因为是16位单片机,程序以字为单位,有的指令竟然占6个字节。虽然程序表面上简洁, 但与pic单片机比较空间占用很大

应用范围：

在低功耗及超低功耗的工业场合应用的比较多

使用最多的器件：MSP430F系列、MSP430G2系列、MSP430L09系列

TMS单片机

这里也提一下TMS系列单片机，虽不算主流。由TI推出的8位CMOS单片机,具有多种存储模式、多种外围接口模式,适用于复杂的实时控制场合。虽然没STM32那么优秀，也没MSP430那么张扬，但是TMS370C系列单片机提供了通过整合先进的外围功能模块及各种芯片的内存配置，具有高性价比的实时系统控制。

同时采用高性能硅栅CMOS EPROM和EEPROM技术实现。低工作功耗CMOS技术，宽工作温度范围，噪声抑制，再加上高性能和丰富的片上外设功能，使TMS370C系列单片机在汽车电子，工业电机控制，电脑，通信和消费类具有一定的应用。

STM32单片机

由ST厂商推出的STM32系列单片机，行业的朋友都知道，这是一款性价比超高的系列单片机，应该没有之一，功能及其强大。其基于专为要求高性能、低成本、低功耗的嵌入式应用专门设计的ARM Cortex-M内核。

同时具有一流的外设：1μs的双12位ADC，4兆位/秒的UART，18兆位/秒的SPI等等，在功耗和集成度方面也有不俗的表现，当然和MSP430的功耗比起来是稍微逊色的一些，但这并不影响工程师们对它的热捧程度，由于其简单的结构和易用的工具再配合其强大的功能在行业中赫赫有名…

特性：

内核：单周期乘法和硬件除法
存储器：片上集成32-512KB的Flash存储器。6-64KB的SRAM存储器
时钟、复位和电源管理：2.0-3.6V的电源供电和I/O接口的驱动电压。POR、PDR和可编程的电压探测器(PVD)。4-16MHz的晶振。内嵌出厂前调校的8MHz RC振荡电路。内部40 kHz的RC振荡电路。用于CPU时钟的PLL。带校准用于RTC的32kHz的晶振
调试模式：串行调试(SWD)和JTAG接口。最多高达112个的快速I/O端口、最多多达11个定时器、最多多达13个通信接口
使用最多的器件：STM32F103系列、STM32 L1系列、STM32W系列

PIC单片机

PIC单片机系列是美国微芯公司(Microship)的产品，共分三个级别,即基本级、中级、高级，是当前市场份额增长最快的单片机之一，CPU采用RISC结构,分别有33、35、58条指令,属精简指令集。

同时采用Harvard双总线结构,运行速度快，它能使程序存储器的访问和数据存储器的访问并行处理。这种指令流水线结构，在一个周期内完成两部分工作，一是执行指令，二是从程序存储器取出下一条指令。这样总的看来每条指令只需一个周期，这也是高效率运行的原因之一，此外PIC单片机之所以成为一时非常热的单片机不外乎以下特点：

特点：

具有低工作电压、低功耗、驱动能力强等特点。PIC系列单片机的I/O口是双向的,其输出电路为CMOS互补推挽输出电路。I/O脚增加了用于设置输入或输出状态的方向寄存器,从而解决了51系列I/O脚为高电平时同为输入和输出的状态。
当置位1时为输入状态,且不管该脚呈高电平或低电平,对外均呈高阻状态;置位0时为输出状态,不管该脚为何种电平,均呈低阻状态,有相当的驱动能力,低电平吸入电流达25mA,高电平输出电流可达20mA。相对于51系列而言,这是一个很大的优点。
它可以直接驱动数码管显示且外电路简单。它的A/D为10位,能满足精度要求。具有在线调试及编程(ISP)功能。

不足之处：

其专用寄存器(SFR)并不像51系列那样都集中在一个固定的地址区间内(80～FFH),而是分散在四个地址区间内。只有5个专用寄存器PCL、STATUS、FSR、PCLATH、INTCON在4个存储体内同时出现，但是在编程过程中,少不了要与专用寄存器打交道,得反复地选择对应的存储体,也即对状态寄存器STATUS的第6位(RP1)和第5位(RP0)置位或清零。

数据的传送和逻辑运算基本上都得通过工作寄存器W(相当于51系列的累加器A)来进行,而51系列的还可以通过寄存器相互之间直接传送,因而PIC单片机的瓶颈现象比51系列还要严重,这在编程中的朋友应该深有体会。

使用最多的器件：PIC16F873、PIC16F877

AVR单片机

AVR单片机是Atmel公司推出的较为新颖的单片机,其显著的特点为高性能、高速度、低功耗。它取消机器周期,以时钟周期为指令周期,实行流水作业。

AVR单片机指令以字为单位,且大部分指令都为单周期指令。而单周期既可执行本指令功能,同时完成下一条指令的读取。通常时钟频率用4～8MHz,故最短指令执行时间为250～125ns。

特点：

AVR系列没有类似累加器A的结构,它主要是通过R16～R31寄存器来实现A的功能。在AVR中,没有像51系列的数据指针DPTR,而是由X(由R26、R27组成)、Y(由R28、R29组成)、Z(由R30、R31组成)三个16位的寄存器来完成数据指针的功能(相当于有三组DPTR)。

而且还能作后增量或先减量等的运行，而在51系列中,所有的逻辑运算都必须在A中进行;而AVR却可以在任两个寄存器之间进行,省去了在A中的来回折腾,这些都比51系列出色些

AVR的专用寄存器集中在00～3F地址区间,无需像PIC那样得先进行选存储体的过程,使用起来比PIC方便。AVR的片内RAM的地址区间为0～00DF(AT90S2313) 和0060～025F(AT90S8515、AT90S8535),它们占用的是数据空间的地址,这些片内RAM仅仅是用来存储数据的,通常不具备通用寄存器的功能。

当程序复杂时,通用寄存器R0～R31就显得不够用;而51系列的通用寄存器多达128个(为AVR的4倍),编程时就不会有这种感觉。

AVR的I/O脚类似PIC,它也有用来控制输入或输出的方向寄存器,在输出状态下,高电平输出的电流在10mA左右,低电平吸入电流20mA。这点虽不如PIC,但比51系列还是要优秀的…

缺点：

没有位操作，都是以字节形式来控制和判断相关寄存器位。
C语言与51的C语言在写法上存在很大的差异，这让从开始学习51单片机的朋友很不习惯。
通用寄存器一共32个(R0～R31),前16个寄存器(R0～R15)都不能直接与立即数打交道,因而通用性有所下降。而在51系列中,它所有的通用寄存器(地址00～7FH)均可以直接与立即数打交道,显然要优于前者。

使用最多的器件：ATUC64L3U、ATxmega64A1U、AT90S8515

STC单片机

说到STC单片机有人会说到，STC也能算主流，估计要被喷了~~我们基于它是国内还算是比较不错的单片机来说。

STC单片机是宏晶生产的单时钟/机器周期的单片机，说白了STC单片机是51与AVR的结合体，有人说AVR是51的替代单片机，但是AVR单片机在位控制和C语言写法上存在很大的差异。而STC单片机恰恰结合了51和AVR的优点，虽然功能不及AVR那么强大，但是在AVR能找到的功能，在STC上基本都有，同时STC单片机是51内核，这给以51单片机为基础的工程师们提供了极大的方便，省去了学习AVR的时间，同时也不失AVR的各种功能…

STC单片机是高速、低功耗、超强抗干扰的新一代8051单片机51单片机，指令代码完全兼容传统8051，但速度快8~12倍，内部集成MAX810专用复位电路。4路PWM 、8路高速10位A、D转换，针对电机电机的供应商控制，强干扰场合，成为继51单片机后一个全新系列单片机…

特性：

下载烧录程序用串口方便好用，容易上手，拥有大量的学习资料及视频，最著名的要属于杜老师的那个视频了，好多对单片机有兴趣的朋友都是通过这个视频入门的，同时具有宽电压：5.5～3.8V，2.4～3.8V, 低功耗设计：空闲模式，掉电模式(可由外部中断唤醒)
STC单片机具有在应用编程，调试起来比较方便;带有10位AD、内部EEPROM、可在1T/机器周期下工作，速度是传统51单片机的8~12倍，价格也较便宜
STC12C2052AD系列为2通道，也可用来再实现4个定时器或4个外部中断，2个硬件16位定时器，兼容普通8051的定时器。4路PCA还可再实现4个定时器，具有硬件看门狗、高速SPI通信端口、全双工异步串口,兼容普通8051的串口，同时还具有先进的指令集结构，兼容普通8051指令集。

PS：STC单片机功能虽不及AVR、STM32强大，价格也不及51和ST32便宜，但是这些并并不重要，重要的是这属于国产单片机比较出色的单片机，但愿国产单片机能一路长虹…

使用最多的器件：STC12C2052AD

Freescale单片机

主要针对S08,S12这类单片机，当然Freescale单片机远非于此。Freescale系列单片机采用哈佛结构和流水线指令结构，在许多领域内都表现出低成本，高性能的的特点，它的体系结构为产品的开发节省了大量时间。此外Freescale提供了多种集成模块和总线接口，可以在不同的系统中更灵活的发挥作用!Freescale单片机的特有的特点如下：

全系列：从低端到高端，从8位到32位全系列应有尽有，其推出的8位/32位管脚兼容的QE128，可以从8位直接移植到32位,弥补单片机业界8/32 位兼容架构中缺失的一环
多种系统时钟模块：三种模块，七种工作模式。多种时钟源输入选项，不同的mcu具有不同的时钟产生机制，可以是RC振荡器，外部时钟或晶振，也可以是内部时钟，多数CPU同时具有上述三种模块!可以运行在FEI，FEE，FBI，FBILP，FBE，FBELP，STOP这七种工作模式
多种通讯模块接口：Freescale单片机几乎在内部集成各种通信接口模块：包括串行通信接口模块SCI，多主I2C总线模块,串行外围接口模块 SPI，MSCAN08控制器模块，通用串行总线模块(USB/PS2)
具有更多的可选模块：具有LCD驱动模块，带有温度传感器，具有超高频发送模块，含有同步处理器模块，含有同步处理器的MCU还具有屏幕显示模块OSD，还有少数的MCU具有响铃检测模块RING和双音多频/音调发生器DMG模块
可靠性高，抗干扰性强，多种引脚数和封装选择
低功耗、也许Freescale系列的单片机的功耗没有MSP430的低，但是他具有全静态的“等待”和“停止”两种模式，从总体上降低您的功耗!新近推出的几款超低功耗已经与MSP430的不相上下!

使用最多的器件：MC9S12G系列

如果真要在这些单片机中分个一二三等，那么如果你想跟随大众，无可厚非51单片机还是首选;如果你追求超高性价比，STM32将是你理想选择;如果你渴望超低功耗，MSP430肯定不会让你失望;如果你想支持国产，STC会让你兴奋…

本文转载自：电子发烧友
免责声明：本文为转载文章，转载此文目的在于传递更多信息，版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题，请联系小编进行处理（联系邮箱：cathy@eetrend.com）。

围观 177

ADI的MCU及DSP产品介绍1

演讲人：王勇

来源：https://www.analog.com/

围观 19

一、区别

两则的分流造成的主要原因是数字信号处理的简便性，考虑一个数字信号处理的实例，比如有限冲击响应滤波器（FIR）。用数学语言来说，FIR滤波器是做一系列的点积。取一个输入量和一个序数向量，在系数和输入样本的滑动窗口间作乘法，然后将所有的乘积加起来，形成一个输出样本。

类似的运算在数字信号处理过程中大量的重复发生，使得为此设计的器件必须提供专门的支持，促进了DSP器件与通用处理器（GPP）的分流：

1. 对密集乘法的支持

2. 存储器结构

此外，DSP处理器几乎都不具备数据的高速缓存。这是因为DSP的典型数据是数据流。也就是说，DSP处理器对每个数据样本做计算后，就丢弃，几乎不再重复使用。

3. 零开销循环

DSP算法的一个共同的特点，即大多数处理时间都花在执行较小的循环上，也就容易理解，为什么大多数的DSP都有专门的硬件，用于零开销循环。所谓的零开销循环是指处理器在执行循环时，不用花时间去检查循环计数器的值，条件转移到循环大额顶部，将循环计数器减1.

与此相反，GPP的循环使用软件来实现。某些高性能的GPP使用转移预报硬件，几乎达到与硬件支持零开销循环同样地效果。

二、联系

按照传统方式，嵌入式应用中的数字信号处理器（dsp）相对于主微控制器起到从属的作用。在这些应用中，MCU用作系统控制器，而大量的数据处理留给DSP。例如，在音频或视频处理器应用中有可能需要人机界面管理，或则是整个系统的控制。

为完成这些任务，有几种系统设计方案选择。

第一种方案是将DSP和MCU芯片组合在印制电路板上。这种方案成本高并且占用面积大，但是可适当地调整每个芯片的尺寸以最大限度的满足系统需要。

第二种方案是将DSP功能合并到一个MCU中。这种方案只适合于直接的信号处理应用。MCU的时钟频率和计算体系结构根本上不太适合大量的数字处理。有些ＭＣＵ试图通过增加一个乘法和累加器（ＭＡＣ）（ｄｓｐ的一个特点）来补偿上述不足。但是这种方案任然缺乏高级应用所需要的基本的“由上至下”的体系结构设计。

第三种方案是一种将ｄｓｐ和ｍｃｕ组合在单个封装内的多芯片模块（ｍｃｍ）．这种方案的局限性是，设计工程师必须按“５０／５０”的时间比例分配给控制和DSP功能；例如，一旦DSP超出时间，MCU不能完成计算任务。像第一种方案选择一样，当DSP和MCU内核独立存在的时候，需要两套开发工具。

已经出现第四种方案它是将MCU的功能合并到一个DSP中。这类方案的一个例子是美国模拟器件公司（Anolog Device Inc.,简称ADI）的Blackfin 处理器系列。这些新型处理器具有统一的经过优化的体系结构，不仅适于数据计算，而且也适于有关的控制任务。通过平衡执行控制任务与复杂计算的要求，这种方案可以根据系统实时处理的需要，完成100%的控制或者100%的计算任务。完成所有这一切任务不需要在DSP模式和MCU模式之间的模式转换。

DSP & MCU

首先让我们回顾一下DSP和MCU的典型功能。DSP主要是在一单个时钟周期内尽可能完成多个MAC（乘法和累加）操作。为了这一点，指令的操作代码通常是可变的超长的指令字（VLIW）。DSP也适于工作在紧密、高效的环路中。另外，为了达到性能指标通常需要编写优化的汇编代码。由于DSP的算法程序一般装在小容量、短等待时间的内置存储器中，所以代码密度通常不是大问题。像DSP主要用于完成计算一样，MCU主要用于完成控制功能。同样地，典型的MCU应用包括许多条件操作，在程序流程中频繁地跳转。通常使用C或者C＋＋语言编写程序。代码密度极为重要，并且根据编译代码的长度来评估算法。存储器系统是基于高速缓存从而允许该系统设计工程师用较长等待时间从较大的存储器中调用较大程序。利用基于高速缓存系统，程序员不需要考虑如何以及何时将指令输入到内核去执行。

统一的DSP和MCU兼备两者的优点。它的指令集由16 bit，32 bit和64 bit操作码组成，但是由于最常用的指令采用16 bit编码，所以编译代码密度大小与那些流行的MCU相同。另外，它包括一个存储器保护功能以及指令高速缓存和数据高速缓存，作为整个存储器管理单元（MMU）的一部分。此外，容易提供一套完整的C/C＋＋开发工具，提供可选汇编语言或者全部汇编语言适合算法优化的编程。

RTOS

系统控制的一个重要方面是任务管理。实时操作系统（RTOS）逐渐地用于控制复杂系统中多种正在进行的和同时发生的任务。通过提供对任务调度与管理的支持，RTOS简化了编程模式，这通常是由MCU控制的，由于普通的DSP不具备支持RTOS需要的所有功能以便有效地控制。

然而，统一的DSP和MCU促进了RTOS几个重要功能的发展。第一个是限制访问功能以保护或者保留存储单元。第二个是配备单独的堆栈和帧指针以减少操作系统（OS）请求以及中断和异常处理所需的等待时间。第三个是具备单独的用户操作模式和管理员操作模式。过去，DSP按照等效于管理员操作模式工作，从而允许在任何时间完全访问所有的系统资源。然而MCU提供类似的在用户操作模式，它允许在OS的顶层运行应用软件。现在，在一个统一的体系结构下提供两种操作模式，因为增强的DSP系统能够限制用户应用软件仅通过OS访问系统资源。

MCU的一个优点是包含使用灵活和种类齐全的外围设备。作为通用的嵌入式控制器，它们通常具备可编程输入输出（I/O）标志、定时器、串行接口和日益增加越来越复杂的标准接口。MCU外围设备的主要作用是嵌入式控制，而不是大量计算。例如，一个实时时钟信号可以唤醒一只温度传感器用以采集环境温度并且将一个延迟的信息通过I/O引脚反馈到MCU。然后，一个定时器的脉冲宽度调制（PWM）输出相应地能够增加或者减小风扇电机的转速。像MCU一样，统一的DSP和MCU具备一套系统控制外围设备（例如，实时时钟、多功能定时器、监视定时器、双向标志位引脚）。然而，它还包括一些高速接口（例如，PCI、异步或者同步存储器控制器、USB、并行视频接口）以便通过这些接口，与许多DMA通道配合快速搬移数据，从而有助于有效利用高速DSP内核的信号处理能力。

功耗控制一直是嵌入式控制器的一项功能。但是，当系统要求DSP具有优良的性能时，对其电源的选择就不太理想。如果将独立的MCU和DSP芯片应用于电源敏感的场合，通常必须为每个芯片提供一个单独的开关稳压器，因为这两个器件的内核电压经常不一致。这会导致降低电源变换效率和增加设计器件的引脚数目，最终增加布线的复杂程度和解决方案的成本。此外，当MCU和DSP的内核集成到一个芯片上时，电源解决方案本质上不是最佳的，因为它必须满足2个完全独立并具有不同负载特性处理器的需求。将这种情况与统一的DSP和MCU相比较，它包含一个集成动态电源管理（DPM）控制器。由于它是只有一个处理器的体系结构，所以该控制器能够完全适合给定应用的需求。它提供几种固有的电源模式以支持多种系统性能等级。另外，对于未使用的时钟和L2存储器可选择性地禁止。该PLL的频率可在一个宽范围（通常1倍～31倍）进行调节，以满足在DSP和MCU内部多层次的处理需求。最后能够调节电压（外部或者通过一个集成的开关控制器）以提供指数式的节省功耗。由于系统成本、开发容易、器件采购和升级能力的原因，设计工程师正趋向采用一种单芯片解决方案用于嵌入式信号处理解决方案。这种单芯片解决方案必须能够同样好地完成DSP和MCU的功能，所以有必要提出一种统一的处理器体系结构。面对MCU的挑战，比较简单的解决方案是将MCU的功能合并到一个高性能的DSP内核，而不是与此相反。当今一个统一的DSP和MCU平台（由BlackfinDSP系列产品说明）已经投放市场，它将在MCU和DSP目前应用领域提供许多应用。

本文转自网络，版权归原作者，如果您觉得不好，请联系我们删除！

围观 328

DSP：

DSP（digital singnal processor）是一种独特的微处理器，有自己的完整指令系统，是以数字信号来处理大量信息的器件。一个数字信号处理器在一块不大的芯片内包括有控制单元、运算单元、各种寄存器以及一定数量的存储单元等等，在其外围还可以连接若干存储器，并可以与一定数量的外部设备互相通信，有软、硬件的全面功能，本身就是一个微型计算机。DSP采用的是哈佛设计，即数据总线和地址总线分开，使程序和数据分别存储在两个分开的空间，允许取指令和执行指令完全重叠。也就是说在执行上一条指令的同时就可取出下一条指令，并进行译码，这大大的提高了微处理器的速度。另外还允许在程序空间和数据空间之间进行传输，因为增加了器件的灵活性。

其工作原理是接收模拟信号，转换为0或1的数字信号，再对数字信号进行修改、删除、强化，并在其他系统芯片中把数字数据解译回模拟数据或实际环境格式。它不仅具有可编程性，而且其实时运行速度可达每秒数以千万条复杂指令程序，源源超过通用微处理器，是数字化电子世界中日益重要的电脑芯片。它的强大数据处理能力和高运行速度，是最值得称道的两大特色。

DSP芯片，由于它运算能力很强，速度很快，体积很小，而且采用软件编程具有高度的灵活性，因此为从事各种复杂的应用提供了一条有效途径。其主要应用是实时快速地实现各种数字信号处理算法。根据数字信号处理的要求，DSP芯片一般具有如下主要特点：

（1）在一个指令周期内可完成一次乘法和一次加法；
（2）程序和数据空间分开，可以同时访问指令和数据；
（3）片内具有快速RAM，通常可通过独立的数据总线在两块中同时访问；
（4）具有低开销或无开销循环及跳转的硬件支持；
（5）快速的中断处理和硬件I/O支持；
（6）具有在单周期内操作的多个硬件地址产生器；
（7）可以并行执行多个操作；
（8）支持流水线操作，使取指、译码和执行等操作可以重叠执行。

当然，与通用微处理器相比，DSP芯片的其他通用功能相对较弱些。

DSP优势在于其有独特乘法器，一个指令就可以完成乘加运算，但GPP（通用处理器）处理一般是用加法代替乘法，要n多cpu周期，尽管cpu主频很快，但还是要相当时间，这一点现在的GPP已经基本上可以做到内部单周期运算乘加指令了。

数字信号处理是一种通过使用数学技巧执行转换或提取信息，来处理现实信号的方法，这些信号由数字序列表示。在过去的二十多年时间里，数字信号处理已经在通信等领域得到极为广泛的应用

ARM：

ARM （ Advanced RISC Machines ），既可以认为是一个公司的名字，也可以认为是对一类微处理器的通称，还可以认为是一种技术的名字。1991 年 ARM 公司成立于英国剑桥，主要出售芯片设计技术的授权。目前，采用 ARM技术知识产权（ IP ）核的微处理器，即我们通常所说的 ARM 微处理器，已遍及工业控制、消费类电子产品、通信系统、网络系统、无线系统等各类产品市场，基于 ARM 技术的微处理器应用约占据了 32 位 RISC 微处理器 75 ％以上的市场份额， ARM 技术正在逐步渗入到我们生活的各个方面。 ARM 公司是专门从事基于 RISC 技术芯片设计开发的公司，作为知识产权供应商，本身不直接从事芯片生产，而是转让设计许可由合作公司生产各具特色的芯片，世界各大半导体生产商从ARM公司购买其设计的 ARM 微处理器核，根据各自不同的应用领域，加入适当的外围电路，从而形成自己的 ARM 微处理器芯片进入市场。目前，全世界有几十家大的半导体公司都使用 ARM 公司的授权，因此既使得 ARM 技术获得更多的第三方工具、制造、软件的支持，又使整个系统成本降低，使产品更容易进入市场被消费者所接受，更具有竞争力。

ARM最大的优势在于速度快、低功耗、芯片集成度高，多数ARM芯片都可以算作SOC，基本上外围加上电源和驱动接口就可以做成一个小系统了。

基于ARM核心处理器的嵌入式系统以其自身资源丰富、功耗低、价格低廉、支持厂商众多的缘故，越来越多地应用在各种需要复杂控制和通信功能的嵌入式系统中。

ARM与DSP的比较：

区别：

由于两大处理器在各自领域的飞速发展，如今两者中的高端或比较先进的系列产品中，都在弥补自身缺点、且扩大自身优势，从而使得两者之间的一些明显不同已不再那么明显了，甚至出现两者部分结合的趋势（如ARM的AMBA总线，可以把DSP或其他处理器集成在一块芯片中；又如DSP中的两个系列OMAP和达芬奇系列，就是直接针对两者的广泛应用而将两者结合在一起，从而最大发挥各自优势），另外，两者各自不同系列的产品侧重点也不尽相同，所以这里讨论的是一些传统意义上比较。

总的来说主要区别有：

ARM具有比较强的事务管理功能，可以用来跑界面以及应用程序等，其优势主要体现在控制方面，它的速度和数据处理能力一般，但是外围接口比较丰富，标准化和通用性做的很好，而且在功耗等方面做得也比较好，所以适合用在一些消费电子品方面；

而DSP主要是用来计算的，比如进行加密解密、调制解调等，优势是强大的数据处理能力和较高的运行速度。由于其在控制算法等方面很擅长，所以适合用在对控制要求比较高的场合，比如军用导航、电机伺服驱动等方面。

如果只是着眼于嵌入式应用的话，嵌入式CPU和DSP的区别应该只在于一个偏重控制一个偏重运算了。

另外：

内核源码开放的Linux与ARM体系处理器相结合，可以发挥Linux系统支持各种协议及存在多进程调度机制的优点，从而使开发周期缩短，扩展性增强。

详细来说：

DSP的优势主要是速度，它可以在一个指令周期中同时完成一次乘法和一次加法，这非常适合快速傅立叶变换的需求。DSP有专门的指令集,主要是专门针对通讯和多媒体处理的；而ARM使用的是RISC指令集（当然ARM的E系列也支持DSP指令集）是通用处理用的。

存储器架构和指令集特点不一样

单片机为了存储器管理的方便（便于支持操作系统），一般采用指令、数据空间统一编码的冯·诺依曼结构。 DSP为了提高数据吞吐的速度，基本上都是指令、数据空间独立的哈佛结构。

单片机对于数字计算方面的指令少得多，DSP为了进行快速的数字计算，提高常用的信号处理算法的效率，加入了很多指令，比如单周期乘加指令、逆序加减指令（FFT时特别有用，不是ARM的那种逆序），块重复指令（减少跳转延时）等等，甚至将很多常用的由几个操作组成的一个序列专门设计一个指令可以一周期完成（比如一指令作一个乘法，把结果累加，同时将操作数地址逆序加1），极大的提高了信号处理的速度。由于数字处理的读数、回写量非常大，为了提高速度，采用指令、数据空间分开的方式，以两条总线来分别访问两个空间，同时，一般在DSP内部有高速RAM，数据和程序要先加载到高速片内ram中才能运行。DSP为提高数字计算效率，牺牲了存储器管理的方便性，对多任务的支持要差的多，所以DSP不适合于作多任务控制作用。

1 对密集的乘法运算的支持

GPP不是设计来做密集乘法任务的，即使是一些现代的GPP，也要求多个指令周期来做一次乘法。而DSP处理器使用专门的硬件来实现单周期乘法。DSP处理器还增加了累加器寄存器来处理多个乘积的和。累加器寄存器通常比其他寄存器宽，增加称为结果bits的额外bits来避免溢出。同时，为了充分体现专门的乘法-累加硬件的好处，几乎所有的DSP的指令集都包含有显式的MAC指令。

2 存储器结构

传统上，GPP使用冯.诺依曼存储器结构。这种结构中，只有一个存储器空间通过一组总线（一个地址总线和一个数据总线）连接到处理器核。通常，做一次乘法会发生4次存储器访问，用掉至少四个指令周期。

大多数DSP采用了哈佛结构，将存储器空间划分成两个，分别存储程序和数据。它们有两组总线连接到处理器核，允许同时对它们进行访问。这种安排将处理器存贮器的带宽加倍，更重要的是同时为处理器核提供数据与指令。在这种布局下，DSP得以实现单周期的MAC指令。

还有一个问题，即现在典型的高性能GPP实际上已包含两个片内高速缓存，一个是数据，一个是指令，它们直接连接到处理器核，以加快运行时的访问速度。从物理上说，这种片内的双存储器和总线的结构几乎与哈佛结构的一样了。然而从逻辑上说，两者还是有重要的区别。

GPP使用控制逻辑来决定哪些数据和指令字存储在片内的高速缓存里，其程序员并不加以指定（也可能根本不知道）。与此相反，DSP使用多个片内存储器和多组总线来保证每个指令周期内存储器的多次访问。在使用DSP时，程序员要明确地控制哪些数据和指令要存储在片内存储器中（CMD文件的编写）。程序员在写程序时，必须保证处理器能够有效地使用其双总线。

此外，DSP处理器几乎都不具备数据高速缓存。这是因为DSP的典型数据是数据流。也就是说，DSP处理器对每个数据样本做计算后，就丢弃了，几乎不再重复使用。

3 零开销循环

如果了解到DSP算法的一个共同的特点，即大多数的处理时间是花在执行较小的循环上，也就容易理解，为什么大多数的DSP都有专门的硬件，用于零开销循环。所谓零开销循环是指处理器在执行循环时，不用花时间去检查循环计数器的值、条件转移到循环的顶部、将循环计数器减1（逆序加减指令）。

与此相反，GPP的循环使用软件来实现。某些高性能的GPP使用转移预报硬件，几乎达到与硬件支持的零开销循环同样的效果。

4 定点计算

大多数DSP使用定点计算，而不是使用浮点。虽然DSP的应用必须十分注意数字的精确，用浮点来做应该容易的多，但是对DSP来说，廉价也是非常重要的。定点机器比起相应的浮点机器来要便宜（而且更快）。为了不使用浮点机器而又保证数字的准确，DSP处理器在指令集和硬件方面都支持饱和计算、舍入和移位。

发展趋势：

DSP是否将作为手机的心脏生存下去，目前的争论非常激烈。今天的手机生产采用的是双核方式：DSP芯片处理通信，如调制解调器功能和语音处理等；一块通用处理器（通常是ARM设计的RISC处理器）负责处理手机上运行的各种程序，如用户界面和控制协议堆栈等。随这两种处理器的功能日益强大，或许它们中的一方将会接管另一方目前执行的功能。但问题在于：是ARM取代DSP，还是DSP挤掉ARM？

如果将这三者结合起来，即由DSP结合采样电路采集并处理信号，由ARM处理器作为平台，运行Linux操作系统，将经过DSP运算的结果发送给用户程序进行进一步处理，然后提供给图形化友好的人机交互环境完成数据分析和网络传输等功能，就会最大限度的发挥三者所长。

转自： leoking01-博客园

围观 842

考虑一个数字信号处理的实例，比如有限冲击响应滤波器(FIR)。用数学语言来说，FIR滤波器是做一系列的点积。取一个输入量和一个序数向量，在系数和输入样本的滑动窗口间作乘法，然后将所有的乘积加起来，形成一个输出样本。

类似的运算在数字信号处理过程中大量地重复发生，使得为此设计的器件必须提供专门的支持，促成了了DSP器件与通用处理器(GPP)的分流：

1 对密集的乘法运算的支持

2 存储器结构

传统上，GPP使用冯.诺依曼存储器结构。这种结构中，只有一个存储器空间通过一组总线(一个地址总线和一个数据总线)连接到处理器核。通常，做一次乘法会发生4次存储器访问，用掉至少四个指令周期。

GPP使用控制逻辑来决定哪些数据和指令字存储在片内的高速缓存里，其程序员并不加以指定(也可能根本不知道)。与此相反，DSP使用多个片内存储器和多组总线来保证每个指令周期内存储器的多次访问。在使用DSP时，程序员要明确地控制哪些数据和指令要存储在片内存储器中。程序员在写程序时，必须保证处理器能够有效地使用其双总线。

3 零开销循环

如果了解到DSP算法的一个共同的特点，即大多数的处理时间是花在执行较小的循环上，也就容易理解，为什么大多数的DSP都有专门的硬件，用于零开销循环。所谓零开销循环是指处理器在执行循环时，不用花时间去检查循环计数器的值、条件转移到循环的顶部、将循环计数器减1。

与此相反，GPP的循环使用软件来实现。某些高性能的GPP使用转移预报硬件，几乎达到与硬件支持的零开销循环同样的效果。

4 定点计算

大多数DSP使用定点计算，而不是使用浮点。虽然DSP的应用必须十分注意数字的精确，用浮点来做应该容易的多，但是对DSP来说，廉价也是非常重要的。定点机器比起相应的浮点机器来要便宜(而且更快)。为了不使用浮点机器而又保证数字的准确，DSP处理器在指令集和硬件方面都支持饱和计算、舍入和移位。

从表面上来看，DSP与标准微处理器有许多共同的地方：一个以ALU为核心的处理器、地址和数据总线、RAM、ROM以及I/O端口，从广义上讲，DSP、微处理器和微控制器(单片机)等都属于处理器，可以说DSP是一种CPU。但DSP和一般的CPU又不同：

首先是体系结构：CPU是冯.诺伊曼结构的，而DSP有分开的代码和数据总线即“哈佛结构”，这样在同一个时钟周期内可以进行多次存储器访问——这是因为数据总线也往往有好几组。有了这种体系结构，DSP就可以在单个时钟周期内取出一条指令和一个或者两个(或者更多)的操作数。

标准化和通用性：CPU的标准化和通用性做得很好，支持操作系统，所以以CPU为核心的系统方便人机交互以及和标准接口设备通信，非常方便而且不需要硬件开发了;但这也使得CPU外设接口电路比较复杂，DSP主要还是用来开发嵌入式的信号处理系统了，不强调人机交互，一般不需要很多通信接口，因此结构也较为简单，便于开发。如果只是着眼于嵌入式应用的话，嵌入式CPU和DSP的区别应该只在于一个偏重控制一个偏重运算了。

流水线结构：大多数DSP都拥有流水结构，即每条指令都由片内多个功能单元分别完成取指、译码、取数、执行等步骤，这样可以大大提高系统的执行效率。但流水线的采用也增加了软件设计的难度，要求设计者在程序设计中考虑流水的需要。

快速乘法器：信号处理算法往往大量用到乘加(multiply-accumulate，MAC)运算。DSP有专用的硬件乘法器，它可以在一个时钟周期内完成MAC运算。硬件乘法器占用了DSP芯片面积的很大一部分。(与之相反，通用CPU采用一种较慢的、迭代的乘法技术，它可以在多个时钟周期内完成一次乘法运算，但是占用了较少了硅片资源)。

地址发生器：DSP有专用的硬件地址发生单元，这样它可以支持许多信号处理算法所要求的特定数据地址模式。这包括前(后)增(减)、环状数据缓冲的模地址以及FFT的比特倒置地址。地址发生器单元与主ALU和乘法器并行工作，这就进一步增加了DSP可以在一个时钟周期内可以完成的工作量。

硬件辅助循环：信号处理算法常常需要执行紧密的指令循环。对硬件辅助循环的支持，可以让DSP高效的循环执行代码块而无需让流水线停转或者让软件来测试循环终止条件。

低功耗：DSP的功耗较小，通常在0.5W到4W，采用低功耗的DSP甚至只有0.05W，可用电池供电，很适合嵌入式系统;而CPU的功耗通常在20W以上。

来源：中电网

围观 527

步进电机已经渗透入我们生活的方方面面，本文介绍了一些重要的步进电机相关技术，为开发人员基本了解步进电机的工作原理提供了足够的信息，同时也介绍了用微控制器或数字信号处理器控制步进电机的方法。

步进电机也叫步进器，它利用电磁学原理，将电能转换为机械能，人们早在20世纪20年代就开始使用这种电机。随着嵌入式系统(例如打印机、磁盘驱动器、玩具、雨刷、震动寻呼机、机械手臂和录像机等)的日益流行，步进电机的使用也开始暴增。

不论在工业、军事、医疗、汽车还是娱乐业中，只要需要把某件物体从一个位置移动到另一个位置，步进电机就一定能派上用场。步进电机有许多种形状和尺寸，但不论形状和尺寸如何，它们都可以归为两类：可变磁阻步进电机和永磁步进电机。本文重点讨论更为简单也更常用的永磁步进电机。

步进电机的构造

如图1所示，步进电机是由一组缠绕在电机固定部件--定子齿槽上的线圈驱动的。通常情况下，一根绕成圈状的金属丝叫做螺线管，而在电机中，绕在齿上的金属丝则叫做绕组、线圈、或相。如果线圈中电流的流向如图1所示，并且我们从电机顶部向下看齿槽的顶部，那么电流在绕两个齿槽按逆时针流向流动。根据安培定律和右手准则，这样的电流会产生一个北极向上的磁场。

现在假设我们构造一个定子上缠绕有两个绕组的电机，内置一个能够绕中心任意转动的永久磁铁，这个可旋转部分叫做转子。图2给出了一种简单的电机，叫做双相双极电机，因为其定子上有两个绕组，而且其转子有两个磁极。如果我们按图2a所示方向给绕组1输送电流，而绕组2中没有电流流过，那么电机转子的南极就会自然地按图中所示，指向定子磁场的北极。

再假设我们切断绕组1中的电流，而按图2b所示方向给绕组2输送电流，那么定子的磁场就会指向左侧，而转子也会随之旋转，与定子磁场方向保持一致。

接着，我们再将绕组2的电流切断，按照图2c的方向给绕组1输送电流，注意：这时绕组1中的电流流向与图2a所示方向相反。于是定子的磁场北极就会指向下，从而导致转子旋转，其南极也指向下方。

然后我们又切断绕组1中的电流，按照图2d所示方向给绕组2输送电流，于是定子磁场又会指向右侧，从而使得转子旋转，其南极也指向右侧。

最后，我们再一次切断绕组2中的电流，并给绕组1输送如图2a所示的电流，这样，转子又会回到原来的位置。

至此，我们对电机绕组完成了一个周期的电激励，电机转子旋转了一整圈。也就是说，电机的电频率等于它转动的机械频率。

如果我们用1秒钟顺序完成了图2所示的这4个步骤，那么电机的电频率就是1Hz。其转子旋转了一周，因而其机械频率也是1Hz。总之，一个双相步进电机的电频率和机械频率之间的关系可以用下式表示：

fe=fm*P/2 (1)

其中，fe代表电机的电频率，fm代表其机械频率，而P则代表电机转子的等距磁极数。

从图2中我们还可以看出，每一步操作都会使转子旋转90°，也就是说，一个双相步进电机每一步操作造成的旋转度数可由下式表示：

1 step= 180°/P (2)

由等式(2)可知，一个双极电机每动作一次可以旋转180°/2=90°，这与我们在图2中看到的情形正好相符。此外，该等式还表明，电机的磁极数越多，步进精度就越高。常见的是磁极数在12和200个之间的双相步进电机，这些电机的步进精度在15°和 0.9°之间。

图3给出的例子是一个双相、6极步进电机，其中包含3个永久磁铁，因而有6个磁极。第一步，如图3a所示，我们给绕组1施加电压，在定子中产生一个北极指向其顶部的磁场，于是，转子的南极(图3a中红色的“S”一端)转向了该图的上方。接着，在图3b中，我们给绕组2施加电压，定子中产生一个北极指向其左侧的磁场。

于是，转子的一个距离最近的南极转向了图的左方，即转子顺时针转动了30°。第三步，在图3c中，我们又向绕组1施加一个电压，在定子中产生一个北极指向图下方的磁场，从而又使转子顺时针旋转30°到达图3c所示的位置。而在图3d中，我们给绕组2施加电压，在定子中产生一个北极指向定子右侧的磁场，再一次使转子顺时针旋转30°，到达图3d所示的位置。

最后，我们再向绕组1施加电压，产生一个如图3a所示的北极指向定子上方的磁场，使得转子顺时针旋转30°，结束一个电周期。如此可以看出，4步电激励造成了120°的机械旋转。也就是说，该电机的电频率是机械频率的3倍，这一结果符合等式(1)。此外，我们从图3和等式(2)也能看出，该电机的转子每一步旋转30°。

如果同时向两个绕组输送电流，还能增大电机的扭矩，如图4所示。这时，电机定子的磁场是两个绕组各自产生的磁场的矢量和，虽然这一磁场每一次动作仍然只使电机旋转90°，就象图2和图3中一样，但因为我们同时激励两个电机绕组，所以此时的磁场比单独激励一个绕组时更强。由于该磁场是两个垂直场的矢量和，因此它等于单独每个场的2×1.414倍，从而电机对其负载施加的扭矩也成正比增大。

电机的激励顺序

既然我们知道了一系列激励会使步进电机旋转，接下来就要设计硬件来实现所需的步进序列。一块能让电机动起来的硬件(或结合了硬件和软件的一套设备)就叫做电机驱动器。

从图4中可以看出我们怎样激励双相电机的绕组才能使电机转子旋转，图中，电机内的绕组抽头分别被标为1A、1B、2A和2B。其中，1A和1B是绕组1的两个抽头，2A和2B则是绕组2的两个抽头。

首先，要给脚1B和2B施加一个正电压，并将1A和2A接地。然后，给脚1B和2A施加一个正电压，而将1A和2B接地，这一过程其实取决于导线绕齿槽缠绕的方向，假设导线缠绕的方向与上一节所述相符。依次进行下去，我们就得到了表1中总结的激励顺序，其中，“1”表示正电压，“0”表示接地。

电流在电机绕组中有两种可能的流向，这样的电机就叫做双极电机和双极驱动序列。双极电机通常由一种叫做H桥的电路驱动，图5给出了连接H桥和步进电机两根抽头的电路。

H桥通过一个电阻连接到一个电压固定的直流电源(其幅度可根据电机的要求选取)，然后，该电路再经过4个开关(分别标为S1、S2、S3和S4)连接到绕组的两根抽头。这一电路的分布看起来有点象一个大写字母H，因此叫做H桥。

从表1中可以看出，要激励该电机，第一步应将抽头2A设为逻辑0，2B设为逻辑1，于是，我们可以闭合开关S1和S4，并断开开关S2和S3。接着，需要将抽头2A设为逻辑1，2B设为逻辑0，于是，我们可以闭合S2、S3，并断开S1和S4。与此类似，第三步我们可以闭合S2、S3并断开S1和S4，第四步则可以闭合S1、S4并断开S2、S3。

对绕组1的激励方法也不外乎如此，使用一对H桥就能产生需要的激励信号序列。表2所示就是激励过程中每一步开关所在的位置。

注意，如果R=0，而开关S1和S3又不小心同时闭合，那么流经开关的电流将达到无穷大。这时，不但开关会被烧坏，电源也可能损坏，因此电路中使用了一个非零阻值的电阻。尽管这个电阻会带来一定的功耗，也会降低电机驱动器的效率，但它可以提供短路保护。

单极电机及其驱动器

前面我们已经讨论了双极步进电机和驱动器。单极电机与双极电机类似，不同的是在单极电机中外部能够接触到的只有每个绕组的中心抽头，如图6所示。我们将从绕组顶部抽出的抽头标为抽头B，底部抽出的标为抽头A，中间的为抽头C。

有时我们会遇到一些抽头没有标注的电机，如果我们清楚步进电机的构造，就很容易通过测量抽头之间的阻值，识别出哪些抽头属于哪根绕组。不同绕组的抽头之间阻抗通常为无穷大。如果经测量，抽头A和C之间的阻抗为100欧姆，那么抽头B和C之间的阻抗也应是100欧姆，而A和B之间的阻抗为200欧姆。200欧姆这一阻抗值就叫做绕组阻抗。

图7给出一个单极电机的单相驱动电路。从中可以看出，当S1闭合而S2断开时，电流将由右至左流经电机绕组；而当S1断开，S2闭合时，电流流向变为由左至右。因此，我们仅用两个开关就能改变电流的流向(而在双极电机中需要4个开关才能做到)。表3所示为单极电机驱动电路中，每一步激励时开关所处的位置。

虽然单极电机的驱动器控制起来相对简单，但由于在电机中使用了中心抽头，因此它比双极电机更复杂，而且其价格通常比双极电机贵。此外，由于电流只流经一半的电机绕组，所以单极电机只能产生一半的磁场。

在知道了单极电机和双极电机的构造原理之后，当我们遇到一个没有标示抽头也没有数据手册的电机时，我们就能自己推导出抽头和绕组的关系。带4个抽头的电机就是一个双相双极电机，我们可以通过测量导线之间的阻抗来分辨哪两个抽头属于同一个绕组。带6个抽头的电机可能是一个双相单极电机，也可能是一个三相双极电机，具体情况可以通过测量导线之间的阻抗来确定。

电机控制

本文前面讨论的电机控制理论可以采用全硬件方案实现，也可以用微控制器或DSP实现。图8说明了如何用晶体管作为开关来控制双相单极电机。每个晶体管的基极都要通过一个电阻连接到微控制器的一个数字输出上，阻值可以从1到10M欧姆，用于限制流入晶体管基极的电流。每个晶体管的发射极均接地，集电极连到电机绕组的4个抽头。电机的中心抽头均连接到电源电压的正端。

每个晶体管的集电极均通过一个二极管连接到电压源，以保护晶体管不被旋转时电机绕组上的感应电流烧坏。转子旋转时，电机绕组上会出现一个感应电压，如果晶体管集电极没有通过二极管连接到电压源，感应电压造成的电流就会涌入晶体管的集电极。

举个例子，假设数字输出do1为高而do2为低，于是do1会使晶体管T1导通，电流从+V流经中心抽头和T1的基极，然后由T1的发射极输出。但此时do2处于断开状态，因此电流无法流经T2。这样推理下去，我们就能将表3改为驱动电机所需的微控制器数字输出的改变顺序。

一旦清楚了驱动电机所需的硬件和数字输出的顺序，我们就可以对最顺手的微控制器或DSP编写软件，实现这些序列。

固件控制

我本人在一块Microchip PIC16F877上，利用1N4003二极管和2SD1276A达灵顿晶体管实现了以上谈到的电机控制器。PIC的PortA第0位到第3位用来做数字输出。电机采用在Jameco购买的5V双相单极电机(Airpax [Thomson]生产，型号为M82101-P1)，并且用同一个5V电源为PIC和电机供电。但在真正应用时，为避免给微控制器的电源信号引入噪声，建议大家还是分别用不同的电源为电机和微控制器供电。

列表1给出了控制程序的汇编源代码，该程序每50毫秒旋转电机一次。首先，程序会将微控制器的数字输出初始化为表4中第一步的值，然后每隔50毫秒(此时间常数由程序中的常量waitTime定义)按照正确的顺序循环输出数字信号。若需使电机反向旋转，只需按与表4所示相反的顺序输出数字信号即可。

本人所用的电机为24极电机，即每一步输出可以控制电机旋转180°/24=7.5°。电机每50毫秒旋转7.5°，也就是每2.4秒转一周。如果将常量waitTime减小一半，电机转速会加快一倍。但因为转子受惯性、摩擦力和其他机械限制，所以电机转速有一个上限，当定子磁场旋转过快时，转子的转速无法跟上，导致电机的旋转也无法跟上，开始跳动(skipping)。如果这时再降低欧姆aitTime，电机很可能干脆就停止旋转。

除了本文重点讨论的双相电机以外，步进电机还有其他类型，如三相步进电机或四相步进电机。另外还有一些双相步进电机，它们只有一个中心抽头，同时连接到两个绕组的中心点，这类步进电机外部有5个抽头引出。

同样，步进电机也不是电机家族中的唯一成员，最古老也最简单的电机是直流(DC)电机。早期的直流电机使用电刷，现在已经不再流行。如今常见的无刷直流电机，就是利用电子线路代替电刷进行换向的直流电机，这类电机中不存在电刷老化问题，因此其寿命比有刷直流电机长很多。

还有一种感应电机，其工作原理与步进电机或直流电机完全不同。直流电机采用的是直流电压源，而感应电机则采用交流(AC)电压源，并且步进电机和直流电机中转子与定子磁场的旋转是同步的，而感应电机中转子的转速滞后于定子磁场的转速。

本文小结

本文对步进电机进行了概括性的介绍，更多的细节等待着您的发现。但只要您理解了本文介绍的电机工作原理，那么您就已经完全可以开始设计、维护和调试步进电机的驱动软、硬件了。

转自：单片机

围观 351

1.引言

数字信号处理器是一种适合于实现各种数字信号处理运算的微处理器，具有下列主要结构特点：
（1）采用改进型哈佛（Harvard）结构，具有独立的程序总线和数据总线，可同时访问指令和数据空间，允许实际在程序存储器和数据存储器之间进行传输；
（2）支持流水线处理，处理器对每条指令的操作分为取指、译码、执行等几个阶段，在某一时刻同时对若干条指令进行不同阶段的处理；
（3）片内含有专门的硬件乘法器，使乘法可以在单周期内完成；
（4）特殊的指令结构和寻址方式，满足数字信号处理FFT、卷积等运算要求；
（5）快速的指令周期，能够在每秒钟内处理数以千万次乃至数亿次定点或浮点运算；
（6）大多设置了单独的DMA总线及其控制器，可以在基本不影响数字信号处理速度的情况下进行高速的并行数据传送。

由一片DSP加上存储器、模/数转换单元和外设接口就可以构成一个完整的控制系统，但这种方案要达到高速实时控制是不可行的。因为一个实时控制系统一般需要完成数据采集、模/数转换、分析计算、数/模转换、实时过程控制以及显示等任务，单靠一片DSP来完成这些工作势必会大大延长系统对控制对象的控制周期，从而影响整个系统的性能。所以我们添加一个CPU，负责数据采集、模/数转换、过程控制以及人机接口等任务，使DSP专注于系统控制算法的实现，充分利用它的高速数据处理能力。从性能价格比的角度出发，这个CPU采用8位的51系列。这时，两个CPU之间的数据共享就成了一个重要的问题。

采用双口RAM（简称DRAM）是解决CPU之间的数据共享的有效办法。与串行通信相比，采用双口RAM不仅数据传输速度高，而且抗干扰性能好。在笔者实验室研制的电力有源滤波器中，选用了TI公司的第三代DSP芯片TMS320C32和51系列单片机89C52作为控制系统的CPU。两个CPU之间通过双口RAM CY7C133完成数据交换。但在实际使用过程中遇到了89C52 与双口RAM总线宽度不匹配的问题，需要进行接口电路的设计。

2.双口RAM CY7C133的内部结构和功能

CY7C133是CYPRESS公司研制的高速2K×16CMOS双端口静态RAM，具有两套相互独立、完全对称的地址总线、数据总线和控制总线，采用68脚 PLCC封装形式，最大访问时间可以为25/35/55 ns。采用主从模式可以方便地将数据总线扩展成32位或更宽。各引脚的功能如表1所示，内部功能框图如图1所示。

　　
CY7C133允许两个CPU同时读取任何存储单元（包括同时读同一地址单元），但不允许同时写或一读一写同一地址单元，否则就会发生错误。双口RAM中引入了仲裁逻辑（忙逻辑）电路来解决这个问题：当左右两端口同时写入或一读一写同一地址单元时，先稳定的地址端口通过仲裁逻辑电路优先读写，同时内部电路使另一个端口的信号有效，并在内部禁止对方访问，直到本端口操作结束。BUSY信号可以作为中断源指明本次操作非法。在主从模式中，主芯片的信号接上拉电阻作为输出，从芯片的信号作为写禁止输入。

3.DSP、单片机与双口RAM之间的接口电路

89C52的地址总线宽度为16位，数据总线为8位；TMS320C32的数据总线宽度为32位，地址总线宽度为24位。而CY7C133的数据总线宽度为16位，地址总线宽度为11位，所以TMS320C32与双口RAM的接口并无特别之处，但是89C52与双口RAM之间的接口电路中就需要对89C52进行总线扩展了。具体做法是利用锁存器74HC373的锁存功能，通过对其使能信号的控制，进行分时读写，实现数据总线的扩展，即利用锁存器作为虚拟总线。具体的读写过程、读写信号及锁存器使能信号的产生将在下面详细说明。DSP、单片机与双口RAM之间的接口电路如图2所示。

　　
TMS320C32分配给双口RAM的地址空间为0x800000h～0x8007FFh。通过三八译码器74HC138对A20～A23和STRB进行译码，给出双口RAM的片选信号CER。89C52分配给双口RAM的地址空间为0x1000h～0x1FFFh。通过二四译码器74HC139对A13～A15进行译码产生双口RAM的片选信号CEL。双口RAM每边都有两个读/写控制信号，分别控制高位字节和低位字节的读/写，在使用时可以根据需要分别对数据的高位和低位进行写入操作。在图2所示接口电路中，两边的两个读/写控制信号分别被连接在一起，也就是说此时双口RAM的读写都是同时读写16位数据。

图2中双口RAM CY7C133的读写信号以及锁存器74HC373的使能信号的产生如图3所示。其中，WR是89C52的写控制信号，RD是89C52的读控制信号，A0是89C52的地址最低位，A15是地址最高位，R/W是TMS320C32的读写控制信号，BUSYL接89C52的P1口的一个引脚（具体可根据系统实际情形自行选择，图中未画出），BUSYR接TMS320C32的READY信号。

　　
下面讨论一下89C52对双口RAM的读写过程。当89C52对双口RAM进行读数据时，由图3可知此时A0应为低电平，不妨假设地址为0x1000h，则存储在双口RAM中该地址处的16位数据同时被读出，由于高8位数据线与89C52的8位数据线直接相连，所以高8位数据被立即读入89C52中。同时，根据图3中各信号的相互逻辑关系不难判断，U3的使能信号LE有效（高电平），OE无效（低电平），因而低8位数据被送入U3 中锁存起来。接着89C52再进行一次读操作，这时地址变为0x1001h，由于A0变成高电平，双口RAM的读使能信号变成无效电平，所以此次读操作对双口RAM不产生影响。再来看U3的使能信号LE和OE的变化情况，显然LE变成了无效电平，而OE变成了有效电平，上次被锁存的数据（即双口RAM的低8位数据）被送入89C52。当89C52对双口RAM进行写入操作时，注意此时A0应为高电平，不妨假设地址为0x100Ch，同样可根据图3判断U2的使能信号LE和OE均为有效电平，因而数据被同时写入双口RAM中（即此时双口RAM的高8位数据和低8位相同）；接着89C52再进行一次写操作，此时地址变为0x100Dh，由于A0变成低电平，U2的片选为无效电平，U2被封锁，数据写入双口RAM的高8位。从上面的分析可知，利用最低地址位A0的不同电平，89C52通过两次连续的读或写操作，成功地实现了对双口RAM中数据的读或写，只不过是读入时是先读入高8位，后读入低8位；而写入则是先写入低8位，后写入高8位。

4.软件实现方案

双口RAM必须采用一定的机制来协调左右两边CPU对它的读写操作，否则会出现读写数据的错误。通常可以用中断、硬件、令牌和软件这四种方式来协调双方，本文采用的是软件方式。从上面的分析中我们可以得知，在接口电路中实际上已经利用89C52的最低地址位A0把双口RAM的存储空间分为奇、偶地址两个空间。其中，奇地址空间专供89C52写，偶地址空间专供89C52读。那么我们只需对TMS320C32的软件作相应处理即可，也就是说，TMS320C32对双口RAM的奇地址空间只读，对偶地址空间只写。这样就避免了TMS320C32和89C52对双口RAM同一地址单元的写入操作。另外，在对双口RAM进行访问之前，CPU首先对本端的BUSY信号进行查询，只有本端/BUSY信号无效时才进行读写操作，进一步保证了数据读写的可靠性。

5.结束语

通过双口RAM实现双CPU之间的数据通信，极大地提高了数据传输速度和可靠性，满足了控制系统的实时、高速的控制要求。本文所设计的89C52与双口RAM之间的接口电路简单实用，成功解决了它们总线匹配的问题，对其他类似需要总线扩展的系统也有一定的参考价值。

来源：捷配电子市场

围观 295

微控制单元（Microcontroller Unit；MCU），又称单片微型计算机（Single Chip Microcomputer ）或者单片机，是把中央处理器（Central Process Unit；CPU）的频率与规格做适当缩减，并将内存（memory）、计数器（Timer）、USB、A/D转换、UART、PLC、DMA等周边接口，甚至LCD驱动电路都整合在单一芯片上，形成芯片级的计算机，为不同的应用场合做不同组合控制。诸如手机、PC外围、遥控器，至汽车电子、工业上的步进马达、机器手臂的控制等，都可见到MCU的身影。

技术原理

MCU同温度传感器之间通过I2C总线连接。I2C总线占用2条MCU输入输出口线，二者之间的通信完全依靠软件完成。温度传感器的地址可以通过2根地址引脚设定，这使得一根I2C总线上可以同时连接8个这样的传感器。本方案中，传感器的7位地址已经设定为1001000。MCU需要访问传感器时，先要发出一个8位的寄存器指针，然后再发出传感器的地址（7位地址，低位是WR信号）。传感器中有3个寄存器可供MCU使用，8位寄存器指针就是用来确定MCU究竟要使用哪个寄存器的。本方案中，主程序会不断更新传感器的配置寄存器，这会使传感器工作于单步模式，每更新一次就会测量一次温度。

要读取传感器测量值寄存器的内容，MCU必须首先发送传感器地址和寄存器指针。MCU发出一个启动信号，接着发出传感器地址，然后将RD/WR管脚设为高电平，就可以读取测量值寄存器。

为了读出传感器测量值寄存器中的16位数据，MCU必须与传感器进行两次8位数据通信。当传感器上电工作时，默认的测量精度为9位，分辨力为0.5 C/LSB（量程为-128.5 C至128.5 C）。本方案采用默认测量精度，根据需要，可以重新设置传感器，将测量精度提高到12位。如果只要求作一般的温度指示，比如自动调温器，那么分辨力达到1 C就可以满足要求了。这种情况下，传感器的低8位数据可以忽略，只用高8位数据就可以达到分辨力1 C的设计要求。由于读取寄存器时是按先高8位后低8位的顺序，所以低8位数据既可以读，也可以不读。只读取高8位数据的好处有二，第一是可以缩短MCU和传感器的工作时间，降低功耗；第二是不影响分辨力指标。

MCU读取传感器的测量值后，接下来就要进行换算并将结果显示在LCD上。整个处理过程包括：判断显示结果的正负号，进行二进制码到BCD码的转换，将数据传到LCD的相关寄存器中。

数据处理完毕并显示结果之后，MCU会向传感器发出一个单步指令。单步指令会让传感器启动一次温度测试，然后自动进入等待模式，直到模数转换完毕。MCU发出单步指令后，就进入LPM3模式，这时MCU系统时钟继续工作，产生定时中断唤醒CPU。定时的长短可以通过编程调整，以便适应具体应用的需要。

主要区别

在20世纪最值得人们称道的成就中，就有集成电路和电子计算机的发展。20世纪70年代出现的微型计算机，在科学技术界引起了影响深远的变革。在70年代中期，微型计算机家族中又分裂出一个小小的派系--单片机。随着4位单片机出现之后，又推出了8位的单片机。MCS48系列，特别是MCS51系列单片机的出现，确立了单片机作为微控制器（MCU）的地位，引起了微型计算机领域新的变革。在当今世界上，微处理器（MPU）和微控制器（MCU）形成了各具特色的两个分支。它们互相区别，但又互相融合、互相促进。与微处理器（MPU）以运算性能和速度为特征的飞速发展不同，微控制器（MCU）则是以其控制功能的不断完善为发展标志的。

CPU（Central Processing Unit，中央处理器）发展出来三个分枝，一个是DSP（Digital Signal Processing/Processor，数字信号处理），另外两个是MCU（Micro Control Unit，微控制器单元）和MPU（Micro Processor Unit，微处理器单元）。

MCU集成了片上外围器件；MPU不带外围器件（例如存储器阵列），是高度集成的通用结构的处理器，是去除了集成外设的MCU；DSP运算能力强，擅长很多的重复数据运算，而MCU则适合不同信息源的多种数据的处理诊断和运算，侧重于控制，速度并不如DSP。MCU区别于DSP的最大特点在于它的通用性，反应在指令集和寻址模式中。DSP与MCU的结合是DSC，它终将取代这两种芯片。

1.对密集的乘法运算的支持

2. 存储器结构

传统上，GPP使用冯诺依曼存储器结构。这种结构中，只有一个存储器空间通过一组总线（一个地址总线和一个数据总线）连接到处理器核。通常，做一次乘法会发生4次存储器访问，用掉至少四个指令周期。

大多数DSP采用了哈佛结构，将存储器空间划分成两个，分别存储程序和数据。它们有两组总线连接到处理器核，允许同时对它们进行访问。这种安排将处理器存储器的带宽加倍，更重要的是同时为处理器核提供数据与指令。在这种布局下，DSP得以实现单周期的MAC指令。

典型的高性能GPP实际上已包含两个片内高速缓存，一个是数据，一个是指令，它们直接连接到处理器核，以加快运行时的访问速度。从物理上说，这种片内的双存储器和总线的结构几乎与哈佛结构的一样了。然而从逻辑上说，两者还是有重要的区别。

GPP使用控制逻辑来决定哪些数据和指令字存储在片内的高速缓存里，其程序员并不加以指定（也可能根本不知道）。与此相反，DSP使用多个片内存储器和多组总线来保证每个指令周期内存储器的多次访问。在使用DSP时，程序员要明确地控制哪些数据和指令要存储在片内存储器中。程序员在写程序时，必须保证处理器能够有效地使用其双总线。

3.零开销循环

与此相反，GPP的循环使用软件来实现。某些高性能的GPP使用转移预报硬件，几乎达到与硬件支持的零开销循环同样的效果。

4.定点计算

5.专门的寻址方式

DSP处理器往往都支持专门的寻址模式，它们对通常的信号处理操作和算法是很有用的。例如，模块（循环）寻址（对实现数字滤波器延时线很有用）、位倒序寻址（对FFT很有用）。这些非常专门的寻址模式在GPP中是不常使用的，只有用软件来实现。

6.执行时间的预测

大多数的DSP应用（如蜂窝电话和调制解调器）都是严格的实时应用，所有的处理必须在指定的时间内完成。这就要求程序员准确地确定每个样本需要多少处理时间，或者，至少要知道，在最坏的情况下，需要多少时间。如果打算用低成本的GPP去完成实时信号处理的任务，执行时间的预测大概不会成为什么问题，应为低成本GPP具有相对直接的结构，比较容易预测执行时间。然而，大多数实时DSP应用所要求的处理能力是低成本GPP所不能提供的。这时候，DSP对高性能GPP的优势在于，即便是使用了高速缓存的DSP，哪些指令会放进去也是由程序员（而不是处理器）来决定的，因此很容易判断指令是从高速缓存还是从存储器中读取。DSP一般不使用动态特性，如转移预测和推理执行等。因此，由一段给定的代码来预测所要求的执行时间是完全直截了当的。从而使程序员得以确定芯片的性能限制。

7.定点DSP指令集

定点DSP指令集是按两个目标来设计的：使处理器能够在每个指令周期内完成多个操作，从而提高每个指令周期的计算效率。将存贮DSP程序的存储器空间减到最小（由于存储器对整个系统的成本影响甚大，该问题在对成本敏感的DSP应用中尤为重要）。为了实现这些目标，DSP处理器的指令集通常都允许程序员在一个指令内说明若干个并行的操作。例如，在一条指令包含了MAC操作，即同时的一个或两个数据移动。在典型的例子里，一条指令就包含了计算FIR滤波器的一节所需要的所有操作。这种高效率付出的代价是，其指令集既不直观，也不容易使用（与GPP的指令集相比）。 GPP的程序通常并不在意处理器的指令集是否容易使用，因为他们一般使用象C或C++等高级语言。而对于DSP的程序员来说，不幸的是主要的DSP应用程序都是用汇编语言写的（至少部分是汇编语言优化的）。这里有两个理由：首先，大多数广泛使用的高级语言，例如C，并不适合于描述典型的DSP算法。其次， DSP结构的复杂性，如多存储器空间、多总线、不规则的指令集、高度专门化的硬件等，使得难于为其编写高效率的编译器。即便用编译器将C源代码编译成为DSP的汇编代码，优化的任务仍然很重。典型的DSP应用都具有大量计算的要求，并有严格的开销限制，使得程序的优化必不可少（至少是对程序的最关键部分）。因此，考虑选用DSP的一个关键因素是，是否存在足够的能够较好地适应DSP处理器指令集的程序员。

8.开发工具的要求

因为DSP应用要求高度优化的代码，大多数DSP厂商都提供一些开发工具，以帮助程序员完成其优化工作。例如，大多数厂商都提供处理器的仿真工具，以准确地仿真每个指令周期内处理器的活动。无论对于确保实时操作还是代码的优化，这些都是很有用的工具。 GPP厂商通常并不提供这样的工具，主要是因为GPP程序员通常并不需要详细到这一层的信息。GPP缺乏精确到指令周期的仿真工具，是DSP应用开发者所面临的的大问题：由于几乎不可能预测高性能GPP对于给定任务所需要的周期数，从而无法说明如何去改善代码的性能。

发展历史

单片机出现的历史并不长，但发展十分迅猛。它的产生与发展和微处理器的产生与发展大体同步，自1971年美国Intel公司首先推出4位微处理器以来，它的发展到目前为止大致可分为5个阶段。下面以Intel公司的单片机发展为代表加以介绍。

1971-1976

单片机发展的初级阶段。 1971年11月Intel公司首先设计出集成度为2000只晶体管/片的4位微处理器Intel 4004，并配有RAM、 ROM和移位寄存器，构成了第一台MCS—4微处理器，而后又推出了8位微处理器Intel 8008，以及其它各公司相继推出的8位微处理器。

1976-1980

低性能单片机阶段。以1976年Intel公司推出的MCS—48系列为代表，采用将8位CPU、 8位并行I/O接口、8位定时/计数器、RAM和ROM等集成于一块半导体芯片上的单片结构，虽然其寻址范围有限（不大于4 KB），也没有串行I/O， RAM、 ROM容量小，中断系统也较简单，但功能可满足一般工业控制和智能化仪器、仪表等的需要。

1980-1983

高性能单片机阶段。这一阶段推出的高性能8位单片机普遍带有串行口，有多级中断处理系统，多个16位定时器/计数器。片内RAM、 ROM的容量加大，且寻址范围可达64 KB，个别片内还带有A/D转换接口。

1983-80年代末

16位单片机阶段。 1983年Intel公司又推出了高性能的16位单片机MCS－96系列，由于其采用了最新的制造工艺，使芯片集成度高达12万只晶体管/片。

1990年代

单片机在集成度、功能、速度、可靠性、应用领域等全方位向更高水平发展。

按照单片机的特点，单片机的应用分为单机应用与多机应用。在一个应用系统中，只使用一片单片机称为单机应用。单片机的单机应用的范围包括：

（1）测控系统。用单片机可以构成各种不太复杂的工业控制系统、自适应控制系统、数据采集系统等，达到测量与控制的目的。
（2）智能仪表。用单片机改造原有的测量、控制仪表，促进仪表向数字化、智能化、多功能化、综合化、柔性化方向发展。
（3）机电一体化产品。单片机与传统的机械产品相结合，使传统机械产品结构简化，控制智能化。
（4）智能接口。在计算机控制系统，特别是在较大型的工业测、控系统中，用单片机进行接口的控制与管理，加之单片机与主机的并行工作，大大提高了系统的运行速度。
（5）智能民用产品。如在家用电器、玩具、游戏机、声像设备、电子秤、收银机、办公设备、厨房设备等许多产品中，单片机控制器的引入，不仅使产品的功能大大增强，性能得到提高，而且获得了良好的使用效果。

单片机的多机应用系统可分为功能集散系统、并行多机处理及局部网络系统。

（1）功能集散系统。多功能集散系统是为了满足工程系统多种外围功能的要求而设置的多机系统。
（2）并行多机控制系统。并行多机控制系统主要解决工程应用系统的快速性问题，以便构成大型实时工程应用系统。
（3）局部网络系统。

单片机按应用范围又可分成通用型和专用型。专用型是针对某种特定产品而设计的，例如用于体温计的单片机、用于洗衣机的单片机等等。在通用型的单片机中，又可按字长分为4位、8位、16/32位，虽然计算机的微处理器现在几乎是32/64位的天下，8位、16位的微处理器已趋于萎缩，但单片机情况却不同，8位单片机成本低，价格廉，便于开发，其性能能满足大部分的需要，只有在航天、汽车、机器人等高技术领域，需要高速处理大量数据时，才需要选用16/32位，而在一般工业领域，8位通用型单片机，仍然是目前应用最广的单片机。

到目前为止，中国的单片机应用和嵌入式系统开发走过了二十余年的历程，随着嵌入式系统逐渐深入社会生活各个方面，单片机课程的教学也有从传统的8位处理器平台向32位高级RISC处理器平台转变的趋势，但8位机依然难以被取代。国民经济建设、军事及家用电器等各个领域，尤其是手机、汽车自动导航设备、PDA、智能玩具、智能家电、医疗设备等行业都是国内急需单片机人才的行业。行业高端目前有超过10余万名从事单片机开发应用的工程师，但面对嵌入式系统工业化的潮流和我国大力推动建设“嵌入式软件工厂”的机遇，我国的嵌入式产品要溶入国际市场，形成产业，则必将急需大批单片机应用型人才，这为高职类学生从事这类高技术行业提供了巨大机会。

来源：嵌入式资讯精选

围观 359

MCU加油站

DSP

页面

本土热门MCU

热门话题

应用

热门产品

关键技术

近期产品推荐

近期活动

微信公众号