排序方式: 共有6条查询结果,搜索用时 0 毫秒
1
1.
提出了一种基于数据流图(DFG)的专用指令生成方法.以目标应用的高级语言参考代码为起点,通过编译器前端转化为三地址中间格式,得到有向数据流图.使用提出的基于处理器体系架构约束的静态搜索算法对得到的数据流图进行搜索,得到满足约束的操作组合.结合典型测试序列的动态运行数据对搜索结果进行进一步的筛选,确定对于目标应用性能起关键作用的操作组合,以此作为专用加速指令.该方法实现了数据流图提取的自动化,并结合了静态数据流图搜索与动态结果筛选.通过在视频压缩专用处理器设计中的应用,证明此方法可以快速高效地进行专用指令的自动生成. 相似文献
2.
3.
针对单指令多数据(SIMD)并行多媒体扩展在图像和视频等媒体应用中数据组织和存取等非有效计算开销过大的问题,采用嵌入式处理器面向应用定制指令集的设计思路,通过将数据组织与计算或存取相融合,设计了内嵌数据组织和可变长向量存取两类特殊扩展指令,并与其他基本指令构成了EDO-SIMD(embedded data organization SIMD) 多媒体扩展指令集.性能测试结果表明,EDO-SIMD指令体系可显著降低典型媒体应用核心的非有效计算开销,并提高数据级并行效率. 相似文献
4.
该文提出了一种面向应用优化的片上总线调度策略。以系统通信事件信息为基础,使用最小任务松弛时间与最小总线空闲时间相结合的调度策略,在优先保证满足任务实时要求的基础上,最大限度利用总线空闲时间,提高调度效率。并提供了可配置的权重参数用于总线时间消耗与片上缓冲区容量之间的设计折衷。在双核SoC平台上实现了本文调度方法,并以最新视频编解码标准H.264/AVC为目标应用,与FP(Fixed Priority),SBA(Slack Based Arbitration),RR(Round Robin)等调度方法进行了性能对比。实验结果表明,=0.5时,较以上3种策略,分别平均可减少16.6%、13.2%与9.7%的总线时间,在实时性能方面,较最接近的SBA方法,未实时完成的任务数量减少了59.4%。额外缓冲区开销随的变化关系表明,在最坏情况下(=0)仅需435字节。 相似文献
5.
6.
针对H.264/AVC环内去块效应滤波器算法中分支密集、分支判断条件产生复杂,以及可变阶数有限冲击响应(FIR)滤波算法复杂度高等性能瓶颈,基于专用指令集处理器(ASIP)Schubert平台提出了加法舍入移位指令和两级条件比较指令,并给出了其专用数据通路的设计实现.根据算法分支执行分布情况优化了算法中分支选择部分的实现,保证了代码的高并行度.时钟精确指令集仿真器的运行结果表明,完成强度为4的4×4像素块边界滤波需要140个时钟周期,而完成强度小于4的边界滤波需要100个时钟周期.运行1/4共享中间格式(QCIF)测试序列时, 较x264中的Intel MMX指令实现性能有48%~63%的提升.实验结果表明,使用ASIP实现,可以显著提高去块效应滤波的性能;同时由于其可编程性,可以适应多个视频标准. 相似文献
1