核心处理器的嵌入式系统以其自身资源丰富、功耗低、价格低廉、支持厂商众多的缘故,越来越多地应用在各种需要复杂控制和通信功能的嵌入式系统中。
内核源码开放的Linux与ARM体系处理器相结合,可以发挥Linux系统支持各种协议及存在多进程调度机制的优点,从而使开发周期缩短,扩展性增强。作为数字处理专用电路DSP的数字信号处理能力十分强大,但对诸如任务管理、通信、人机交互等功能的实现较为困难。
如果将这三者结合起来,即由DSP结合采样电路采集并处理信号,由ARM处理器作为平台,运行Linux操作系统,将经过DSP运算的结果发送给用户程序进行进一步处理,然后提供给图形化友好的人机交互环境完成数据分析和网络传输等功能,就会最大限度的发挥三者所长。
该系统硬件由二部分组成,其中一部分为若干块DSP板,各自独立承接数据采集和信号处理。另一部分为以ARM为核心处理器的CPU板。系统硬件框图如图1所示(仅接口部分)。
HPI接口是TI公司新一代、高性能DSP上用以完成与主机或其他DSP之间数据交换的接口,这里主要介绍实际电路中使用的控制引脚和时序。
HCNTL0和HCNTL1为访问控制选择。用来确定主机(ARM)究竟对TMS320C6711中的哪一个HPI寄存器进行处理。具体功能如表1所列。
HHWIL:半字节定义选择,与HPIC寄存器中的HWOB位进行配合可以选择当前传输的是高半字还是低半字。低电平是第一个半字,高电平是第二个半字。
HCS:选通脉冲(Strobe),与HDS1、HDS2相互配合完成内部信号HSTROBE的生成。逻辑关系如图2所示。
ARM处理器通过DSP的HPI接口与DSP进行连接的硬件原理如图4所示(以单板DSP为例)。其中SN74LVTH16245为16位(二个8位)双向三态总线收发器,主要起总线驱动和方向控制的作用同时也保证在不对HPI口进行操作时数据总线为Atmel公司生产的ARM9为核心的处理器,其中引脚D0-D15为数据总线为地址总线FFF FFFF的外部设备进行操作时,会在该引脚产生一个片选信号。同时该信号控制SN74LVTH16245的使能端,避免在读写其他地址时对HPI端口造成影响。TMS320C6711D是TI公司生产的DSP,每秒可以完成15亿次浮点运算,数据处理功能十分强大。引脚D0-D15为数据总线。其余端口是HPI接口的控制引脚。
在Linux操作系统下有二种方式将驱动程序装入操作系统内核:一种是直接将驱动程序编译进内核,另外一种是将驱动程序构建为驱动程序模块后采用insmod/rmmod命令将模块加载内核中。由于是在嵌入式系统中进行程序开,所以笔者选用了模块加载方式。这样,在整个程序的调试过程中不必因为修改某处而反复编译整个内核,只需编译驱动程序模块并重新加载。
本例中Linux下的驱动程序主要用来完成文件(Linux把外部设备也认为是文件)的打开、关闭、读、写等操作。也就是对如下结合的填充。
其中,open和release完成设备的打开和关闭。mmap为内存地址映射操作。因为采用的是模块加载方式,所以还应该加上int init_module(void)和void cleanup_module(void)函数,以完成模块的注册和卸载。
由于驱动程序的内存空间是在内核空间中,因此首先应解决内核空间与用户空间的交互问题。这里采用最直接的方式将内核空间和用户空间联系起来实现映射,即利用remap_page_range内核函数(通过mmap系统调用实现)。
函数的功能是构造用于映射一段物理地址的新页表。函数返回的值通常是0或者一个负的错误码。函数参数的确切含义如下:
应用中需要注意以下字段:unsigned long vm_flags应该使用标志VM_RESERVED,以避免内存管理系统将该VMA交换出去。因为要对DSP写入数据,所以必须使用标志VM_WRITE说明对这一段VMA是允许写入的。pgport_t vm_page_prot指明了对VMA的保护权限。由于利用CS3对DSP的HPI接口进行控制,所以应用pgprot_noncached禁止高速缓冲。 通过mmap的构建就能够将内核空间的数据映射到用户空间去,也就是说可以在用户空间内直接对地址为0x4000_0000的内存空间进行操作,而该段空间正是DSP的HPI接口所对应的地址。
进行调节。该寄存器的D0-D6确定了ARM外部总线的时钟延时周期,D7为等待周期的使能,D12-D14为数据宽度。具体定义如下:AT91_SYS->EBI_SMC2_CSR=0x00003083,即使用16bit数据宽度,等待周期为3个。当ARM主频为180MHz时,CS3低电平脉宽约为150ns。4.3 驱动程序的系统调用接口
为对处于总线的DSP板进行操作,首先应用open打开设备,该设备可以通过mknod建立(本例建立的是/dev/hpi)。然后mmap完成映射。
start指向欲对应的内存地址,size-length的含义是要映射的量;prot代表映射区域的保护方式;flag会影响映射区域的各种特性;fd为文件描述符;offtoffset代表文件的偏移量,通常设置为零。
示例程序中的结构体变量ss用来总知各种变量。通过mmap可以获得映射后的内存地址,用(*ss).hpi_mmap_start表示。
一旦获得了这个起始地址,就能对0x4000_0000起始的总线地址进行操作,因为映射已经完成,对(*ss).hpi_mmap_start的操作就是对0x4000_0000起始的总线地址进行操作,而DSP板HPI接口的控制线正是在这个位置。这样就实现了物理地址和用户空间的转换。
下面以HPI接口读写中最复杂的自增读方式用户程序为例说明用户接口程序的设计过程。要完成自增读的操作,对于HPI一侧,假设采用软件握手的方式。要完成的工作如下:
首先读HPIC以查询其中的HRDY位是否为1,如果为1则表示DSP中数据已经备妥。然后写HPIA以告诉DSP从什么位置开始进行自增读。接着将HPIC的FETCH位置1以刷新写入。再读HPIC以查询其中的HRDY位是否为1,如果为1则表示DSP中数据已经备妥。最后从HPID中读取数据。
对于ARM一侧,要对HPIC、HPID、HPIA寄存器进行读写必须满足HPI接口的定义,具体如下(以自增读为例):
等等,只要改变在HPI_BA_base基础上增加的数字就可以获取对控制口线的操作。 在这里HPI_VA_base将由映射得到的用户空间虚拟地址代替,所以如果“自增模式读HPID第一半字”那么就可求满足前文提到的HCNTL0=0、HCNTL1=1、HR/W=1、HHWRL=0,也就是要满足地址位A2=0、A3=1、A4=1、A5=0,所以只要在HPI_VA_base的基础上加0x0000_0006就可以了。要注意的是ARM处理器的地址是32位。所以是加上0x0000_0006而不是0x0000_0018。
通过改变宏定义中的DSPNUMBER常量可以控制地址总线个总线组合并通过简单地址译码电路就可以完成对多块DSP板的读写。在硬件电路中可以定义为0。
。给出了接口部分的硬件处理和部分驱动程序。在某款智能仪表的研发过程中,给出一个简单的地址译码电路对二块(或更多)DSP板进行交替读写,并以自增读方式进行操作,当ARM主频为180MHz,DSP主频为125MHz时,对DSP数据的读写速度可以达到每毫秒1k的32位字。

