|
分享例程
界面截图: |
|
备注说明: |
未完成,目前支持的最好的就是矩阵乘法…… |
这个模块应该说非常小众,功能不多,最好的一个也只是矩阵乘法,而且有限制:你要有N卡,并且支持cuda
这个模块本身是我做神经网络需要用到的,或许日后会发布一个有关深度学习的模块,但是还早。
虽然比较小众,但是需要用到矩阵乘法的地方也不少。。。
本人CPU i7-8750,在测试时,设置了两个1000*1000的方阵相乘,CPU用时稳定在2700毫秒,GPU除了第一次调用花费282ms,接下来都只需150ms左右
当本人再将长宽扩大2倍,也就是两个2000*2000的方阵相乘时,CPU用时31328ms,而GPU用时900~1000ms,效率提高了约31+倍。
模块里的备注写的还算清晰,使用应该不会太困难。。。
目前未完工,并且不支持自定义加速函数,因为调用GPU加速需要用到CUDA C编写编译,加速函数必须使用特殊的格式写,并不属于一般的子程序。。。本人也只能将加速的算法用CUDA C写出来后编译成DLL供易语言调用,模块,也只是简化了一下调用过程吧。
需要注意的是,模所有代码都没有提供错误检测机制,所以需要使用者注意一些东西,比如矩阵相乘两个矩阵的大小是否合法等等
下载后有5个文件,一个是模块,一个是例程,三个DLL,其中一个是本人自己封装(e-cuda.dll),【剩下两个是运行必要】
|
-
-
mk.zip
532.17 KB, 下载次数: 92, 下载积分: 精币 -2 枚
5个文件
评分
-
查看全部评分
|