共查询到19条相似文献,搜索用时 250 毫秒
1.
近年来,支持多标准的LDPC译码器已逐渐成为研究的热点.与传统译码器相比,所设计的LDPC译码器具有以下优点:1.实现了一个码率、码长可配置结构,进而可以支持多种标准;2.采用了一种改进型TPMP算法,使译码器的存储器容量大大减少,避免了因分块LDPC码的非规则性所造成的数据冲突问题;3.采用基于SIMD处理器的硬件结构,实现了硬件的高度规整性,易于芯片布局布线;4.设计了一个6级可配置流水线,可分时构造校验节点处理单元和变量节点处理单元,提高了硬件利用率和系统数据吞吐率.用这种架构实现了一个同时支持CMMB和DTMB两个标准的多标准LDPC译码器;芯片规模为75万门,时钟频率为220MHz,数据吞吐率为300Mbps. 相似文献
2.
媒体访问控制(MAC)协议负责协调所有认知用户的空闲信道接入服务,是认知 Ad-hoc 网络支持服务质量(QoS)的关键技术之一。在二进制指数退避算法基础上,提出一种支持服务区分的多智能体Q学习MAC算法。实时调整传输概率,使系统信道接入服务达到最优,建立传输概率调节的Markov链模型,导出分组的传输概率与协议参数的关系,给出基于服务区分的信道吞吐率模型,建立基于MAC协议参数学习的多智能体Q学习算法。实验结果表明,该算法能满足高优先级业务的QoS,且吞吐率和时延性能优于IEEE 802.11e EDCA机制。 相似文献
3.
4.
5.
基于确定性有限自动机(DFA)的传统正则表达式匹配方法存在单周期处理单字符的速度瓶颈。为提升处理速率,提出一种单周期处理多字符的匹配算法MC-DFA,该算法基于DFA实现,支持匹配位置的精确定位。MC-DFA将传统DFA中的单字符跳转合并为多字符跳转,实现了单周期处理多个输入字符。通过状态转移矩阵二阶压缩算法,MC-DFA分别对矩阵行内以及行间冗余进行消除,减少了内存使用。300条规则下,单周期处理8字符时,MC-DFA吞吐率能够达到7.88Gb/s,内存占用小于6MB,预处理时间为19.24s。实验结果表明,MC-DFA能够有效提升系统吞吐率,并且保证内存占用在可接受范围之内,性能优于现有正则表达式匹配算法。 相似文献
6.
BWDSP是针对高性能计算设计的一款新型的处理器, 采用多簇超长指令字体系结构和SIMD架构, 有丰富的指令集. 为充分利用BWDSP提供的向量化资源, 迫切需要提出一种向量化算法. 本文在open64基础上研究并实现了面向多簇超长指令字(VLIW)DSP的SIMD编译优化算法. 算法基于OPEN64的中间语言WHIRL, 能够充分地利用BWDSP丰富的硬件资源和向量化指令. 最终实验结果表明, 对于能够合成双字和单字的循环程序, 该优化算法能够平均取得6倍和4倍的加速比. 相似文献
7.
《计算机科学与探索》2016,(8):1072-1079
针对单载波频域均衡(single carrier frequency domain equalization,SC-FDE)技术中的线性均衡技术进行研究分析,在满足通信系统有效性和实时性的要求下,提出了一种低复杂度自适应单载波频域均衡器的FPGA(field-programmable gate array)实现方案。该方案通过对均衡器在算法和体系结构两个方面进行协同设计与优化,引入均衡系数的可配置性支持,在抵抗多径效应的同时,提高了频谱、功率利用率和信号检测效率,大幅削减了系统的计算复杂度,增强了复杂环境适应能力,改善了系统性能。实验结果表明,该方案误码率性能优良,资源利用率高,鲁棒性好,实时性强,综合效能较常规均衡器有了较大的改善,且在40 MHz的带宽下,理想的峰值吞吐率可达115 Mb/s。 相似文献
8.
代数重建算法是解决非完全投影数据重建的有效方法,尤其在对于超出探测器尺寸范围的大型零件的无损检测中已成为最有力的关键技术,但以往算法计算量较大、耗时较长。为了快速地进行代数重建,提出了一种基于Intel处理器单指令多数据(single instruction multiple data,SIMD)技术[2]的快速并行算法,并在充分分析代数重建公式特点的基础上,设计了一套便于并行化运算的数据结构及计算流程,其在运算中可一次性加载多个打包数据,利用MMX(multimedia extension)、SSE(streaming SIMD extension)和SSE2指令完成SIMD方式计算。通过仿真实验证明,该算法在达到同样精度的前提下,不仅提高了重建速度(加速比4倍),解决了传统代数重建算法运算速度慢的瓶颈问题,并且能够较好地重建部分数据缺失的投影图像,该算法对于航空航天大型零部件的无损检测具有重要的理论意义及工程应用价值。 相似文献
9.
10.
多输入多输出(MIMO)技术可以提高系统传输速率、增大系统容量。针对应急通信中短时间内用户激增,传统资源分配算法的系统容量无法满足用户需求的问题,提出一种基于MIMO-OFDM系统用户最小速率的系统容量最大化资源分配算法。该算法考虑了应急场景内通话类等低速率业务剧增的情况,首先根据用户速率由低到高依次分配子载波,然后根据分得的子载波数之比将剩余子载波按照用户速率由高到低分配;对于有盈余带宽的子载波,采用子载波分组的方法再分配,从而 最大化 系统服务用户数。为了补偿信道衰弱和抑制信道间干扰,提出一种对子载波信道矩阵分组的功率分配方法,减少了迭代次数,降低了复杂度。从吞吐量、服务用户数和计算复杂度等方面评估了容量最大化算法的性能。仿真结果表明,相对于传统的资源分配算法,所提算法增加了系统服务用户数,减小了计算复杂度。 相似文献
11.
BWDSP100是一款采用超长指令字(VLIW)和单指令多数据流(SIMD)架构的针对高性能计算领域而设计的32位静态标量数字信号处理器,其指令级并行(ILP)主要是通过其特殊的分簇体系结构和SIMD指令来实现,然而现有的编译框架无法对这些特殊的SIMD指令提供支持。由于BWDSP100拥有丰富的SIMD向量化资源,且其所运用的雷达数字信号处理领域对程序的性能要求极高,因此针对BWDSP100结构的特点,在传统Open64编译器中SIMD编译优化框架的基础上提出并实现了一种支持单双字模式选择的SIMD编译优化算法,通过该算法可以显著提高一些在DSP上有着广泛运用计算密集型程序的性能。实验结果表明,与优化前相比,该算法方案在BWDSP编译器上的实现能够平均取得5.66的加速比。 相似文献
12.
现代3D图形处理器已从固定渲染管线发展成可编程渲染管线,且其并行度越来越高,研究并设计高性能的3D图形处理器对3D图形处理具有重要意义。着色器是实现3D图形处理器的核心,因此开发性能高、面积小、功耗低又易于扩展的着色器对3D图形处理器的开发具有重要作用。提出的统一架构图形处理器基于单指令多线程和单指令多数据,单指令多线程可以提高图形处理的并行度,从而提高图形处理性能;单指令多数据可以降低设计复杂度,从而实现面积小、功耗低又易于扩展的着色器。实验结果表明,提出的统一架构图形处理器在面积较小、功耗较低的情况下实现了较高的性能,且设计可扩展性较好。 相似文献
13.
针对非正规化循环的上下界、步长等循环信息不确定的问题,解决了循环条件为逻辑表达式、增量减量语句和do-while循环的正规化问题。对不能正规化的循环提出了一种展开压紧算法,并用超字并行向量化方法发掘展开压紧的结果。实验结果表明,与现有的非正规化循环的单指令多数据(SIMD)向量化方法相比,所提出的转换方法和展开压紧方法能够更好地发掘非正规化循环的向量化特性,生成代码的性能加速比提高了6%以上。 相似文献
14.
针对SCMA协议没有同时考虑链路服务质量(QoS)和多输入多输出(MIMO)流的信道接入调度策略的不足,提出一种SCMA/QA协议。协议充分考虑了每个链路中不同流的信道状态,建立了一个基于流的信道状态离散马尔可夫链模型,并融合考虑了每条链路的QoS需求,采用修改的RTS/CTS进行链路QoS的信息交换,通过链路QoS权重作为链路选择的主要因素,将MIMO下基于QoS的链路调度问题建模为一个最优化问题,并在卡罗需-库恩-塔克(KKT)条件下得到最优链路以及通信的流数目。最后,以吞吐量为QoS指标进行了数值分析,结果表明在相同网络环境下,SCMA/QA比SCMA和QCSCMA能更好地提高系统的吞吐量。 相似文献
15.
如今单指令多数据流(SIMD)技术在数字信号处理器(DSP)上得到了广泛的应用,现有的向量化编译器大多都实现了自动向量化的功能,但是编译器并不适合支持DSP为特征的SIMD自动向量化,主要由于DSP复杂的指令集、特有的寻址模型,以及依赖关系或者数据非对齐等原因而导致向量化效率不高。为了解决此问题,在基于Open64的超字并行(SLP)自动向量化编译系统后端,对SLP自动向量化中的指令分析和冗余优化算法进行了添加和改进,生成更加高效的向量化源程序。实验结果表明,该优化方法能有效提高DSP性能并降低功耗。 相似文献
16.
针对多输入多输出的广义频分复用(MIMO-GFDM)系统的等效信道矩阵维度极大,传统的MIMO检测算法复杂度高且性能不佳的问题,将大规模MIMO系统中的动态禁忌搜索(RTS)检测算法运用到MIMO-GFDM系统中,并解决了RTS算法初始值的求解复杂度高的问题。首先利用最小均方误差(MMSE)检测算法所用到矩阵的正定对称性将矩阵Cholesky分解,并结合Sherman-Morrison公式迭代计算初始值,降低了初始值求逆的高复杂度;然后以改进的MMSE检测结果作为RTS算法的初始值,从初始值逐步全局搜索最优解;最后通过仿真,对不同算法的迭代次数和误码率(BER)性能进行了研究。理论分析与仿真结果表明:在MIMO-GFDM中,所提改进RTS信号检测算法误码率远低于传统信号检测算法。在4QAM时,RTS算法大约有低于MMSE检测6 dB的信噪比性能增益(误码率在10-3时);在16QAM时,RTS算法大约有低于MMSE检测4 dB的信噪比性能增益(误码率在10-2时)。与传统RTS算法性相比,所提改进算法在不影响误码率性能的同时降低了算法复杂度。 相似文献
17.
当前面向单指令多数据(SIMD)扩展部件的两类向量化方法分别是循环级向量化方法和超字级并行(SLP)方法。针对当前编译器不能实现函数级向量化的问题,提出一种基于静态单赋值的函数级向量化方法。该方法首先分析程序的变量属性,然后利用一组包括向量函数子句、一致子句、线性子句等编译指示子句指导编译器实现函数级向量化,最后利用变量属性结果对向量化代码进行了优化。从多媒体和图像处理领域选择部分测试用例对所提的函数级向量化的功能和性能在国产申威平台上进行测试,与程序串行执行相比,采用函数级向量化后程序的执行效率更高。实验结果表明函数级向量化可以取得类似任务级并行的加速效果,该方法可以指导自动函数级向量化的实现。 相似文献
18.
19.
针对大规模多输入多输出系统基站天线数目众多,移动用户很难实时精确完成信道估计等问题。提出了一种加权的正交匹配追踪算法。该算法在每次迭代过程中,计算得到的估计信号值由当前残差信号估计值和迭代之前估计值两部分组合而成;分别对当前残差信号估计值和迭代之前估计值设置不同的权值,以提高信号在低信噪比情况下的估值精度;通过调整不同迭代次数权值大小,可以提升信号在不同信噪比情况下的计算精度。仿真结果表明,在不同的信噪比情况下,该算法都可以获得比标准正交匹配追踪算法更高的估计精度。 相似文献