从BaseTool 中拆分除GPU的Base、RTPC、TBPImage 等GPU文件

2024-12-24 15:27:09 +08:00 · 2024-12-24 15:27:09 +08:00 · 7ad0acdd5d
parent 16ed299e9f
commit 7ad0acdd5d
11 changed files with 995 additions and 1417 deletions
--- a/BaseTool/GPUTool.cu
+++ b/BaseTool/GPUTool.cu
@ -1,953 +0,0 @@
-
-
-#include <iostream>
-#include <memory>
-#include <cmath>
-#include <complex>
-#include <device_launch_parameters.h>
-#include <cuda_runtime.h>
-#include <cublas_v2.h>
-#include <cuComplex.h>
-
-#include "BaseConstVariable.h"
-#include "GPUTool.cuh"
-
-#ifdef __CUDANVCC___
-
-#define CUDAMEMORY Memory1MB*100
-
-#define LAMP_CUDA_PI 3.141592653589793238462643383279
-
-
-// 定义参数
-__device__  cuComplex cuCexpf(cuComplex x)
-{
-	float factor = exp(x.x);
-	return make_cuComplex(factor * cos(x.y), factor * sin(x.y));
-}
-
-// 定义仿真所需参数
-
-__device__ float GPU_getSigma0dB(CUDASigmaParam param, float theta) {
-	float sigma= param.p1 + param.p2 * exp(-param.p3 * theta) + param.p4 * cos(param.p5 * theta + param.p6);
-	return  sigma;
-}
-
-__device__ CUDAVector GPU_VectorAB(CUDAVector A, CUDAVector B) {
-	CUDAVector C;
-	C.x = B.x - A.x;
-	C.y = B.y - A.y;
-	C.z = B.z - A.z;
-	return C;
-}
-
-__device__ float GPU_VectorNorm2(CUDAVector A) {
-	return sqrtf(A.x * A.x + A.y * A.y + A.z * A.z);
-}
-
-__device__ float GPU_dotVector(CUDAVector A, CUDAVector B) {
-	return A.x * B.x + A.y * B.y + A.z * B.z;
-}
-
-__device__ float GPU_CosAngle_VectorA_VectorB(CUDAVector A, CUDAVector B) {
-	return GPU_dotVector(A, B) / (GPU_VectorNorm2(A) * GPU_VectorNorm2(B));
-}
-
-__device__ CUDAVectorEllipsoidal GPU_SatelliteAntDirectNormal(float RstX, float RstY, float RstZ,
-	float  antXaxisX, float  antXaxisY, float  antXaxisZ,
-	float  antYaxisX, float  antYaxisY, float  antYaxisZ,
-	float  antZaxisX, float  antZaxisY, float  antZaxisZ,
-	float  antDirectX, float  antDirectY, float  antDirectZ
-) {
-	CUDAVectorEllipsoidal result{ 0,0,-1 };
-	float Xst = -1 * RstX; // 卫星 -->  地面
-	float Yst = -1 * RstY;
-	float Zst = -1 * RstZ;
-	float AntXaxisX = antXaxisX;
-	float AntXaxisY = antXaxisY;
-	float AntXaxisZ = antXaxisZ;
-	float AntYaxisX = antYaxisX;
-	float AntYaxisY = antYaxisY;
-	float AntYaxisZ = antYaxisZ;
-	float AntZaxisX = antZaxisX;
-	float AntZaxisY = antZaxisY;
-	float AntZaxisZ = antZaxisZ;
-	// 天线指向在天线坐标系下的值
-	float Xant = (Xst * (AntYaxisY * AntZaxisZ - AntYaxisZ * AntZaxisY) + Xst * (AntXaxisZ * AntZaxisY - AntXaxisY * AntZaxisZ) + Xst * (AntXaxisY * AntYaxisZ - AntXaxisZ * AntYaxisY)) / (AntXaxisX * (AntYaxisY * AntZaxisZ - AntZaxisY * AntYaxisZ) - AntYaxisX * (AntXaxisY * AntZaxisZ - AntXaxisZ * AntZaxisY) + AntZaxisX * (AntXaxisY * AntYaxisZ - AntXaxisZ * AntYaxisY));
-	float Yant = (Yst * (AntYaxisZ * AntZaxisX - AntYaxisX * AntZaxisZ) + Yst * (AntXaxisX * AntZaxisZ - AntXaxisZ * AntZaxisX) + Yst * (AntYaxisX * AntXaxisZ - AntXaxisX * AntYaxisZ)) / (AntXaxisX * (AntYaxisY * AntZaxisZ - AntZaxisY * AntYaxisZ) - AntYaxisX * (AntXaxisY * AntZaxisZ - AntXaxisZ * AntZaxisY) + AntZaxisX * (AntXaxisY * AntYaxisZ - AntXaxisZ * AntYaxisY));
-	float Zant = (Zst * (AntYaxisX * AntZaxisY - AntYaxisY * AntZaxisX) + Zst * (AntXaxisY * AntZaxisX - AntXaxisX * AntZaxisY) + Zst * (AntXaxisX * AntYaxisY - AntYaxisX * AntXaxisY)) / (AntXaxisX * (AntYaxisY * AntZaxisZ - AntZaxisY * AntYaxisZ) - AntYaxisX * (AntXaxisY * AntZaxisZ - AntXaxisZ * AntZaxisY) + AntZaxisX * (AntXaxisY * AntYaxisZ - AntXaxisZ * AntYaxisY));
-	// 计算theta 与 phi
-	float Norm = sqrtf(Xant * Xant + Yant * Yant + Zant * Zant); // 计算 pho
-	float ThetaAnt = acosf(Zant / Norm); // theta 与 Z轴的夹角
-	float YsinTheta = Yant / sinf(ThetaAnt);
-	float PhiAnt = (YsinTheta / abs(YsinTheta)) * acosf(Xant / (Norm * sinf(ThetaAnt)));
-	result.theta = ThetaAnt;
-	result.phi = PhiAnt;
-	result.pho = Norm;
-	return result;
-}
-
-/**
-天线方向图插值方法，以双线性插值算法为基础，由theta与phi组合得到的矩阵图为基础数据，通过插值计算的方法获取目标点的数据。
-其中行是theta、列是phi
-*/
-__device__ float GPU_BillerInterpAntPattern(float* antpattern,
-	float starttheta, float startphi, float dtheta, float dphi,
-	long thetapoints, long phipoints,
-	float searththeta, float searchphi) {
-	float stheta = searththeta;
-	float sphi = searchphi;
-	if (stheta > 90) {
-		return 0;
-	}
-	else {}
-
-
-	float pthetaid = (stheta - starttheta) / dtheta;// 
-	float pphiid = (sphi - startphi) / dphi;
-
-	long lasttheta = floorf(pthetaid);
-	long nextTheta = lasttheta + 1;
-	long lastphi = floorf(pphiid);
-	long nextPhi = lastphi + 1;
- 
-
-	if (lasttheta < 0 || nextTheta < 0 || lastphi < 0 || nextPhi < 0 ||
-		lasttheta >= thetapoints || nextTheta >= thetapoints || lastphi >= phipoints || nextPhi >= phipoints)
-	{
-		return 0;
-	}
-	else {
-		float x = stheta;
-		float y = sphi;
-
-		float x1 = lasttheta * dtheta + starttheta;
-		float x2 = nextTheta * dtheta + starttheta;
-		float y1 = lastphi * dphi + startphi;
-		float y2 = nextPhi * dphi + startphi;
-
-		float z11 = antpattern[lasttheta * phipoints + lastphi];
-		float z12 = antpattern[lasttheta * phipoints + nextPhi];
-		float z21 = antpattern[nextTheta * phipoints + lastphi];
-		float z22 = antpattern[nextTheta * phipoints + nextPhi];
-
-
-		//z11 = powf(10, z11 / 10); // dB-> 线性
-		//z12 = powf(10, z12 / 10);
-		//z21 = powf(10, z21 / 10);
-		//z22 = powf(10, z22 / 10);
-
-		float GainValue = (z11 * (x2 - x) * (y2 - y)
-			+ z21 * (x - x1) * (y2 - y)
-			+ z12 * (x2 - x) * (y - y1)
-			+ z22 * (x - x1) * (y - y1));
-		GainValue = GainValue / ((x2 - x1) * (y2 - y1));
-		return GainValue;
-	}
-}
-
-__device__ cuComplex  GPU_calculationEcho(float sigma0, float TransAnt, float ReciveAnt,
-	float localangle, float R, float slopeangle, float Pt, float lamda) {
-	float r = R;
-	float amp = Pt * TransAnt * ReciveAnt;
-	amp = amp * sigma0;
-	amp = amp / (powf(4 * LAMP_CUDA_PI, 2) * powf(r, 4)); // 反射强度
-	float phi = (-4 * LAMP_CUDA_PI / lamda) * r;
-	cuComplex echophi = make_cuComplex(0, phi);
-	cuComplex echophiexp = cuCexpf(echophi);
-	cuComplex echo;
-	echo.x = echophiexp.x * amp;
-	echo.y = echophiexp.y * amp;
-	return echo;
-}
-
-__global__ void CUDA_DistanceAB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* R, long len) {
-	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	if (idx < len) {
-		R[idx] = sqrtf(powf(Ax[idx] - Bx[idx], 2) + powf(Ay[idx] - By[idx], 2) + powf(Az[idx] - Bz[idx], 2));
-	}
-}
-
-__global__ void CUDA_B_DistanceA(float* Ax, float* Ay, float* Az, float Bx, float By, float Bz, float* R, long len) {
-	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	if (idx < len) {
-		R[idx] = sqrtf(powf(Ax[idx] - Bx, 2) + powf(Ay[idx] - By, 2) + powf(Az[idx] - Bz, 2));
-	}
-}
-
-__global__ void CUDA_make_VectorA_B(float sX, float sY, float sZ, float* tX, float* tY, float* tZ, float* RstX, float* RstY, float* RstZ, long len) {
-	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	if (idx < len) {
-		RstX[idx] = sX - tX[idx]; // 地面->天
-		RstY[idx] = sY - tY[idx];
-		RstZ[idx] = sZ - tZ[idx];
-	}
-}
-
-__global__ void CUDA_Norm_Vector(float* Vx, float* Vy, float* Vz, float* R, long len) {
-	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	if (idx < len) {
-		R[idx] = sqrtf(powf(Vx[idx], 2) + powf(Vy[idx], 2) + powf(Vz[idx], 2));
-	}
-}
-
-__global__ void CUDA_cosAngle_VA_AB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* anglecos, long len) {
-	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	if (idx < len) {
-		float tAx = Ax[idx];
-		float tAy = Ay[idx];
-		float tAz = Az[idx];
-		float tBx = Bx[idx];
-		float tBy = By[idx];
-		float tBz = Bz[idx];
-		float AR = sqrtf(powf(tAx, 2) + powf(tAy, 2) + powf(tAz, 2));
-		float BR = sqrtf(powf(tBx, 2) + powf(tBy, 2) + powf(tBz, 2));
-		float dotAB = tAx * tBx + tAy * tBy + tAz * tBz;
-		float result = acosf(dotAB / (AR * BR));
-		anglecos[idx] = result;
-	}
-}
-
-__global__ void CUDA_SatelliteAntDirectNormal(float* RstX, float* RstY, float* RstZ,
-	float  antXaxisX, float  antXaxisY, float  antXaxisZ,
-	float  antYaxisX, float  antYaxisY, float  antYaxisZ,
-	float  antZaxisX, float  antZaxisY, float  antZaxisZ,
-	float  antDirectX, float  antDirectY, float  antDirectZ,
-	float* thetaAnt, float* phiAnt
-	, long len) {
-	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	if (idx < len) {
-		float Xst		= -1 * RstX[idx]; // 卫星 -->  地面
-		float Yst		= -1 * RstY[idx];
-		float Zst		= -1 * RstZ[idx];
-		float AntXaxisX = antXaxisX;
-		float AntXaxisY = antXaxisY;
-		float AntXaxisZ = antXaxisZ;
-		float AntYaxisX = antYaxisX;
-		float AntYaxisY = antYaxisY;
-		float AntYaxisZ = antYaxisZ;
-		float AntZaxisX = antZaxisX;
-		float AntZaxisY = antZaxisY;
-		float AntZaxisZ = antZaxisZ;
-
-		// 归一化
-		float RstNorm		= sqrtf(Xst * Xst + Yst * Yst + Zst * Zst);
-		float AntXaxisNorm = sqrtf(AntXaxisX * AntXaxisX + AntXaxisY * AntXaxisY + AntXaxisZ * AntXaxisZ);
-		float AntYaxisNorm = sqrtf(AntYaxisX * AntYaxisX + AntYaxisY * AntYaxisY + AntYaxisZ * AntYaxisZ);
-		float AntZaxisNorm = sqrtf(AntZaxisX * AntZaxisX + AntZaxisY * AntZaxisY + AntZaxisZ * AntZaxisZ);
-
-
-		float Rx = Xst / RstNorm;
-		float Ry = Yst / RstNorm;
-		float Rz = Zst / RstNorm;
-		float Xx = AntXaxisX / AntXaxisNorm;
-		float Xy = AntXaxisY / AntXaxisNorm;
-		float Xz = AntXaxisZ / AntXaxisNorm;
-		float Yx = AntYaxisX / AntYaxisNorm;
-		float Yy = AntYaxisY / AntYaxisNorm;
-		float Yz = AntYaxisZ / AntYaxisNorm;
-		float Zx = AntZaxisX / AntZaxisNorm;
-		float Zy = AntZaxisY / AntZaxisNorm;
-		float Zz = AntZaxisZ / AntZaxisNorm;
-
-		float Xant =	(Rx * Yy * Zz - Rx * Yz * Zy - Ry * Yx * Zz + Ry * Yz * Zx + Rz * Yx * Zy - Rz * Yy * Zx) / (Xx * Yy * Zz - Xx * Yz * Zy - Xy * Yx * Zz + Xy * Yz * Zx + Xz * Yx * Zy - Xz * Yy * Zx);
-		float Yant =	-(Rx * Xy * Zz - Rx * Xz * Zy - Ry * Xx * Zz + Ry * Xz * Zx + Rz * Xx * Zy - Rz * Xy * Zx) / (Xx * Yy * Zz - Xx * Yz * Zy - Xy * Yx * Zz + Xy * Yz * Zx + Xz * Yx * Zy - Xz * Yy * Zx);
-		float Zant =	(Rx * Xy * Yz - Rx * Xz * Yy - Ry * Xx * Yz + Ry * Xz * Yx + Rz * Xx * Yy - Rz * Xy * Yx) / (Xx * Yy * Zz - Xx * Yz * Zy - Xy * Yx * Zz + Xy * Yz * Zx + Xz * Yx * Zy - Xz * Yy * Zx);
- 
-		
-		// 计算theta 与 phi
-		float Norm = sqrtf(Xant * Xant + Yant * Yant + Zant * Zant); // 计算 pho
-		float ThetaAnt = acosf(Zant / Norm); // theta 与 Z轴的夹角
-		float PhiAnt = atanf(Yant / Xant); // -pi/2 ~pi/2
-
-
-		if (abs(Yant) < PRECISIONTOLERANCE) { // X轴上
-			PhiAnt = 0;
-		}
-		else if (abs(Xant) < PRECISIONTOLERANCE) { // Y轴上，原点
-			if (Yant > 0) {
-				PhiAnt = PI / 2;
-			}
-			else {
-				PhiAnt = -PI / 2;
-			}
-		}
-		else if (Xant < 0) {
-			if (Yant > 0) {
-				PhiAnt = PI + PhiAnt;
-			}
-			else {
-				PhiAnt = -PI+PhiAnt ;
-			}
-		}
-		else {  // Xant>0  X 正轴
-
-		}
-
-		if (isnan(PhiAnt)) {
-			printf("V=[%f,%f,%f];norm=%f;thetaAnt=%f;phiAnt=%f;\n", Xant, Yant, Zant,Norm, ThetaAnt, PhiAnt);
-		}
-
-		//if (abs(ThetaAnt - 0) < PRECISIONTOLERANCE) {
-		//	PhiAnt = 0;
-		//}
-		//else {}
-
-
-		thetaAnt[idx] = ThetaAnt*r2d;
-		phiAnt[idx] = PhiAnt*r2d;
-		//printf("Rst=[%f,%f,%f];AntXaxis = [%f, %f, %f];AntYaxis=[%f,%f,%f];AntZaxis=[%f,%f,%f];phiAnt=%f;thetaAnt=%f;\n", Xst, Yst, Zst
-		//	, AntXaxisX, AntXaxisY, AntXaxisZ
-		//	, AntYaxisX, AntYaxisY, AntYaxisZ
-		//	, AntZaxisX, AntZaxisY, AntZaxisZ
-		//	, phiAnt[idx]
-		//	, thetaAnt[idx]
-		//);
-	}
-}
-
-__global__ void CUDA_BillerInterpAntPattern(float* antpattern,
-	float starttheta, float startphi, float dtheta, float dphi,
-	long thetapoints, long phipoints,
-	float* searththeta, float* searchphi, float* searchantpattern,
-	long len) {
-	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	if (idx < len) {
-		float stheta = searththeta[idx];
-		float sphi = searchphi[idx];
-		float pthetaid = (stheta - starttheta) / dtheta;// 
-		float pphiid = (sphi - startphi) / dphi;
-
-		long lasttheta = floorf(pthetaid);
-		long nextTheta = lasttheta + 1;
-		long lastphi = floorf(pphiid);
-		long nextPhi = lastphi + 1;
-
-		if (lasttheta < 0 || nextTheta < 0 || lastphi < 0 || nextPhi < 0 ||
-			lasttheta >= thetapoints || nextTheta >= thetapoints || lastphi >= phipoints || nextPhi >= phipoints)
-		{
-			searchantpattern[idx] = 0;
-		}
-		else {
-			float x = stheta;
-			float y = sphi;
-
-			float x1 = lasttheta * dtheta + starttheta;
-			float x2 = nextTheta * dtheta + starttheta;
-			float y1 = lastphi * dphi + startphi;
-			float y2 = nextPhi * dphi + startphi;
-
-			float z11 = antpattern[lasttheta * phipoints + lastphi];
-			float z12 = antpattern[lasttheta * phipoints + nextPhi];
-			float z21 = antpattern[nextTheta * phipoints + lastphi];
-			float z22 = antpattern[nextTheta * phipoints + nextPhi];
-
-
-			z11 = powf(10, z11 / 10);
-			z12 = powf(10, z12 / 10);
-			z21 = powf(10, z21 / 10);
-			z22 = powf(10, z22 / 10);
-
-			float GainValue = (z11 * (x2 - x) * (y2 - y)
-				+ z21 * (x - x1) * (y2 - y)
-				+ z12 * (x2 - x) * (y - y1)
-				+ z22 * (x - x1) * (y - y1));
-			GainValue = GainValue / ((x2 - x1) * (y2 - y1));
-			searchantpattern[idx] = GainValue;
-		}
-	}
-}
-
-
-__global__ void CUDA_Test_HelloWorld(float a, long len) {
-	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	printf("\nidx:\t %d %d \n", idx, len);
-}
-
-
-__global__ void CUDA_RTPC(
-	float antPx, float antPy, float antPz,// 天线坐标
-	float  antXaxisX, float  antXaxisY, float  antXaxisZ,  
-	float  antYaxisX, float  antYaxisY, float  antYaxisZ,  
-	float  antZaxisX, float  antZaxisY, float  antZaxisZ,
-	float  antDirectX, float  antDirectY, float  antDirectZ, 
-	float* demx, float* demy, float* demz, long* demcls,  
-	float* demslopex, float* demslopey, float* demslopez, float* demslopeangle, 
-	float* Tantpattern, float Tstarttheta, float Tstartphi, float Tdtheta, float Tdphi, long Tthetapoints, long Tphipoints, 
-	float* Rantpattern, float Rstarttheta, float Rstartphi, float Rdtheta, float Rdphi, long Rthetapoints, long Rphipoints, 
-	float lamda, float fs, float nearrange, float Pt, long Freqnumbers, // 参数
-	CUDASigmaParam* sigma0Paramslist, long sigmaparamslistlen,// 地表覆盖类型-sigma插值对应函数-ulaby
-	cuComplex* outecho, int* d_echoAmpFID,
-	int linecount,int plusepoint) {
-	int  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	//printf("\nidx:\t %d %d %d\n", idx, linecount, plusepoint);
-	if (idx < linecount* plusepoint) {
-		long clsid = demcls[idx];
-		CUDAVector Rs{ antPx,antPy,antPz };
-		CUDAVector Rt{ demx[idx],demy[idx],demz[idx] };
-		CUDAVector Rst{ Rs.x - Rt.x,Rs.y - Rt.y,Rs.z - Rt.z };
-		CUDAVector Vslope{ demslopex[idx],demslopey[idx],demslopez[idx] };
-		float R = GPU_VectorNorm2(Rst); // 斜距
-		float slopeangle = demslopeangle[idx];
-		CUDAVectorEllipsoidal Rtanttheta = GPU_SatelliteAntDirectNormal( // 地面目标在天线的位置
-			Rst.x, Rst.y, Rst.z,
-			antXaxisX, antXaxisY, antXaxisZ,
-			antYaxisX, antYaxisY, antYaxisZ,
-			antZaxisX, antZaxisY, antZaxisZ,
-			antDirectX, antDirectY, antDirectZ);
-
-		float localangle = GPU_CosAngle_VectorA_VectorB(Rst, Vslope); // 距地入射角
-		float sigma = GPU_getSigma0dB(sigma0Paramslist[clsid], localangle * r2d);
-		sigma = powf(10.0, sigma / 10.0);// 后向散射系数
-		//printf("\ntheta: %f\t,%f ,%f ,%f ,%f ,%f ,%f \n", localangle * r2d, sigma0Paramslist[clsid].p1, sigma0Paramslist[clsid].p2, sigma0Paramslist[clsid].p3,
-		//	sigma0Paramslist[clsid].p4, sigma0Paramslist[clsid].p5, sigma0Paramslist[clsid].p6);
-		// 发射方向图
-		float transPattern =  GPU_BillerInterpAntPattern(Tantpattern,
-			Tstarttheta, Tstartphi, Tdtheta, Tdphi, Tthetapoints, Tphipoints,
-			Rtanttheta.theta, Rtanttheta.phi) * r2d;
-
-		// 接收方向图
-		float receivePattern =  GPU_BillerInterpAntPattern(Rantpattern,
-			Rstarttheta, Rstartphi, Rdtheta, Rdphi, Rthetapoints, Rphipoints,
-			Rtanttheta.theta, Rtanttheta.phi) * r2d;
-		// 计算振幅、相位
-		float amp = Pt * transPattern * receivePattern * sigma * (1 / cos(slopeangle) * sin(localangle));
-		amp = amp / (powf(4 * LAMP_CUDA_PI, 2) * powf(R, 4));
-		float phi = (-4 * LAMP_CUDA_PI / lamda) * R;
-
-		// 构建回波
-		cuComplex echophi = make_cuComplex(0, phi);
-		cuComplex echophiexp = cuCexpf(echophi);
-		float timeR = 2 * (R - nearrange) / LIGHTSPEED * fs;
-		long timeID = floorf(timeR);
-		if (timeID < 0 || timeID >= Freqnumbers) {
-			timeID = 0;
-			amp = 0;
-		}
-		else {}
-
-		cuComplex echo;
-		echo.x = echophiexp.x * amp;
-		echo.y = echophiexp.y * amp;
-		outecho[idx] = echo;
-		d_echoAmpFID[idx] = timeID;
-	}
-
-
-}
-
-
-__global__ void CUDA_TBPImage(
-	float* antPx, float* antPy, float* antPz,
-	float* imgx, float* imgy, float* imgz,
-	cuComplex* echoArr, cuComplex* imgArr,
-	float freq, float fs, float Rnear, float Rfar,
-	long rowcount, long colcount,
-	long prfid, long freqcount
-) {
-	int  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	//printf("\nidx:\t %d %d %d\n", idx, linecount, plusepoint);
-	if (idx < rowcount * colcount) {
-		float R = sqrtf(powf(antPx[prfid] - imgx[idx], 2) + powf(antPy[prfid] - imgy[idx], 2) + powf(antPz[prfid] - imgz[idx], 2));
-		float Ridf = ((R - Rnear) * 2 / LIGHTSPEED) * fs;
-		long Rid = floorf(Ridf);
-		if(Rid <0|| Rid >= freqcount){}
-		else {
-			float factorj = freq * 4 * PI / LIGHTSPEED;
-			cuComplex Rphi =cuCexpf(make_cuComplex(0, factorj * R));// 校正项
-			imgArr[idx] = cuCaddf(imgArr[idx], cuCmulf(echoArr[Rid] , Rphi));// 矫正
-		}
-	}
-}
-
-
-__global__ void CUDA_calculationEcho(float* sigma0, float* TransAnt, float* ReciveAnt,
-	float* localangle, float* R, float* slopeangle,
-	float nearRange, float Fs, float Pt, float lamda, long FreqIDmax,
-	cuComplex* echoArr, long* FreqID,
-	long len) {
-	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	if (idx < len) {
-		float r = R[idx];
-		float amp = Pt * TransAnt[idx] * ReciveAnt[idx];
-		amp = amp * sigma0[idx];
-		amp = amp / (powf(4 * LAMP_CUDA_PI, 2) * powf(r, 4)); // 反射强度
-
-		// 处理相位
-		float phi = (-4 * LAMP_CUDA_PI / lamda) * r;
-		cuComplex echophi = make_cuComplex(0, phi);
-		cuComplex echophiexp = cuCexpf(echophi);
-
-		float timeR = 2 * (r - nearRange) / LIGHTSPEED * Fs;
-		long timeID = floorf(timeR);
-		if (timeID < 0 || timeID >= FreqIDmax) {
-			timeID = 0;
-			amp = 0;
-		}
-
-		cuComplex echo;
-		echo.x = echophiexp.x * amp;
-		echo.y = echophiexp.y * amp;
-		echoArr[idx] = echo;
-		FreqID[idx] = timeID;
-	}
-}
-
-
-__global__ void CUDA_AntPatternInterpGain(float* anttheta, float* antphi, float* gain,
-	float* antpattern, float starttheta, float startphi, float dtheta, float dphi, int thetapoints, int phipoints, long len) {
-	int  idx = blockIdx.x * blockDim.x + threadIdx.x;
- 
-	if (idx < len) {
-
-		float temptheta = anttheta[idx];
-		float tempphi = antphi[idx];
-		
-
-		float antPatternGain =  GPU_BillerInterpAntPattern(antpattern,
-			starttheta, startphi, dtheta, dphi, thetapoints, phipoints,
-			temptheta, tempphi) ;
-		gain[idx] = antPatternGain;
-	}
-}
-
-//__global__ void Sigma0InterpPixel(long* demcls, float* demslopeangle, CUDASigmaParam* sigma0Paramslist, float* localangle, float* sigma0list, long sigmaparamslistlen, long len)
-//{
-//	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-//	if (idx < len) {
-//		long clsid = demcls[idx];
-//		if(clsid<=)
-//		sigma0list[idx] = 0;
-//	}
-//}
-
-
-__global__ void CUDA_InterpSigma(
-	long* demcls, float* sigmaAmp, float* localanglearr, long len,
-	CUDASigmaParam* sigma0Paramslist, long sigmaparamslistlen) {
-	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
-	if (idx < len) {
-		long clsid = demcls[idx];
-		float localangle = localanglearr[idx] * r2d;
-		CUDASigmaParam tempsigma = sigma0Paramslist[clsid];
-		//printf("cls:%d;localangle=%f;\n",clsid, localangle);
-
-		if (localangle < 0 || localangle >= 90) {
-			sigmaAmp[idx] = 0;
-		}
-		else {}
-
-		if (abs(tempsigma.p1)< PRECISIONTOLERANCE&&
-			abs(tempsigma.p2) < PRECISIONTOLERANCE &&
-			abs(tempsigma.p3) < PRECISIONTOLERANCE &&
-			abs(tempsigma.p4) < PRECISIONTOLERANCE&&
-			abs(tempsigma.p5) < PRECISIONTOLERANCE&&
-			abs(tempsigma.p6) < PRECISIONTOLERANCE
-			) {
-			sigmaAmp[idx] = 0;
-		}
-		else {
-			float sigma = GPU_getSigma0dB(tempsigma, localangle);
-			sigma = powf(10.0, sigma / 10.0);// 后向散射系数
-			//printf("cls:%d;localangle=%f;sigma0=%f;\n", clsid, localangle, sigma);
-			sigmaAmp[idx] = sigma;
-		}
-	}
-}
-
-
-
-
-//错误提示
-void checkCudaError(cudaError_t err, const char* msg) {
-	if (err != cudaSuccess) {
-		std::cerr << "CUDA error: " << msg << " (" << cudaGetErrorString(err) << ")" << std::endl;
-		exit(EXIT_FAILURE);
-	}
-
-}
-
-// 主机参数内存声明
-extern "C"  void* mallocCUDAHost(long memsize) {
-	void* ptr;
-	cudaMallocHost(&ptr, memsize);
-
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("mallocCUDAHost CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-	return ptr;
-}
-
-// 主机参数内存释放
-extern "C"  void FreeCUDAHost(void* ptr) {
-	cudaFreeHost(ptr);
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("FreeCUDAHost CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-// GPU参数内存声明
-extern "C" void* mallocCUDADevice(long memsize) {
-	void* ptr;
-	cudaMalloc(&ptr, memsize);
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("mallocCUDADevice CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-	return ptr;
-}
-
-// GPU参数内存释放
-extern "C" void FreeCUDADevice(void* ptr) {
-	cudaFree(ptr);
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("FreeCUDADevice CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-// GPU 内存数据转移
-extern "C" void HostToDevice(void* hostptr, void* deviceptr, long memsize) {
-	cudaMemcpy(deviceptr, hostptr, memsize, cudaMemcpyHostToDevice);
- 
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("HostToDevice CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-
-	cudaDeviceSynchronize();
-}
-
-extern "C" void DeviceToHost(void* hostptr, void* deviceptr, long memsize) {
-	cudaMemcpy(hostptr, deviceptr, memsize, cudaMemcpyDeviceToHost);
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("DeviceToHost CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-extern "C" void CUDATestHelloWorld(float a,long len) {
-	// 设置 CUDA 核函数的网格和块的尺寸
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	// 调用 CUDA 核函数
-	CUDA_Test_HelloWorld << <numBlocks, blockSize >> > (a, len);
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("FreeCUDADevice CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-void CUDATBPImage(float* antPx, float* antPy, float* antPz,
-	float* imgx, float* imgy, float* imgz, 
-	cuComplex* echoArr, cuComplex* imgArr,
-	float freq, float fs, float Rnear, float Rfar,
-	long rowcount, long colcount, 
-	long prfid, long freqcount)
-{
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (rowcount * colcount + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	//printf("\nCUDA_RTPC_SiglePRF blockSize:%d ,numBlock:%d\n",blockSize,numBlocks);
-	// 调用 CUDA 核函数 CUDA_RTPC_Kernel
-
-	CUDA_TBPImage << <numBlocks, blockSize >> > (
-		 antPx,   antPy,   antPz,
-		  imgx,  imgy,   imgz,
-		  echoArr,   imgArr,
-		  freq,   fs,   Rnear,   Rfar,
-		  rowcount,   colcount,
-		  prfid,   freqcount
-		);
-
-
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDATBPImage CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-extern "C" void distanceAB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* R, long len) {
-	// 设置 CUDA 核函数的网格和块的尺寸
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	// 调用 CUDA 核函数
-	CUDA_DistanceAB << <numBlocks, blockSize >> > (Ax, Ay, Az, Bx, By, Bz, R, len);
-
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-extern "C" void BdistanceAs(float* Ax, float* Ay, float* Az, float Bx, float By, float Bz, float* R, long len) {
-	// 设置 CUDA 核函数的网格和块的尺寸
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	// 调用 CUDA 核函数
-	CUDA_B_DistanceA << <numBlocks, blockSize >> > (Ax, Ay, Az, Bx, By, Bz, R, len);
-
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-extern "C" void make_VectorA_B(float sX, float sY, float sZ, float* tX, float* tY, float* tZ, float* RstX, float* RstY, float* RstZ, long len) {
-	// 设置 CUDA 核函数的网格和块的尺寸
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	// 调用 CUDA 核函数
-	CUDA_make_VectorA_B << <numBlocks, blockSize >> > (sX, sY, sZ, tX, tY, tZ, RstX, RstY, RstZ, len);
-
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-extern "C" void Norm_Vector(float* Vx, float* Vy, float* Vz, float* R, long len) {
-	// 设置 CUDA 核函数的网格和块的尺寸
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	// 调用 CUDA 核函数
-	CUDA_Norm_Vector << <numBlocks, blockSize >> > (Vx, Vy, Vz, R, len);
-
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-extern "C" void cosAngle_VA_AB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* anglecos, long len) {
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	// 调用 CUDA 核函数
-	CUDA_cosAngle_VA_AB << <numBlocks, blockSize >> > (Ax, Ay, Az, Bx, By, Bz, anglecos, len);
-
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-extern "C" void SatelliteAntDirectNormal(float* RstX, float* RstY, float* RstZ,
-	float  antXaxisX, float  antXaxisY, float  antXaxisZ,
-	float  antYaxisX, float  antYaxisY, float  antYaxisZ,
-	float  antZaxisX, float  antZaxisY, float  antZaxisZ,
-	float  antDirectX, float  antDirectY, float  antDirectZ,
-	float* thetaAnt, float* phiAnt
-	, long len) {
-
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	// 调用 CUDA 核函数
-	CUDA_SatelliteAntDirectNormal << <numBlocks, blockSize >> > (RstX, RstY, RstZ,
-		antXaxisX, antXaxisY, antXaxisZ,
-		antYaxisX, antYaxisY, antYaxisZ,
-		antZaxisX, antZaxisY, antZaxisZ,
-		antDirectX, antDirectY, antDirectZ,
-		thetaAnt, phiAnt
-		, len);
-
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-
-}
-
-extern "C" void   AntPatternInterpGain(float* anttheta, float* antphi, float* gain,
-	float* antpattern, float starttheta, float startphi, float dtheta, float dphi, int thetapoints, int phipoints, long len) {
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	//printf("\nCUDA_RTPC_SiglePRF blockSize:%d ,numBlock:%d\n", blockSize, numBlocks);
-
-	CUDA_AntPatternInterpGain << <numBlocks, blockSize >> > ( anttheta,antphi, gain,
-		 antpattern, 
-		 starttheta,  startphi,  dtheta,  dphi,  thetapoints,  phipoints,
-		len);
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
- 
-
-extern "C" void CUDARTPCPRF(float antPx, long len) {
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	printf("\nCUDA_RTPC_SiglePRF blockSize:%d ,numBlock:%d\n", blockSize, numBlocks);
-	CUDA_Test_HelloWorld << <numBlocks, blockSize >> > (antPx, len);
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-
-extern "C" void calculationEcho(float* sigma0, float* TransAnt, float* ReciveAnt,
-	float* localangle, float* R, float* slopeangle,
-	float nearRange, float Fs, float pt, float lamda, long FreqIDmax,
-	cuComplex* echoAmp, long* FreqID,
-	long len)
-{
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	// 调用 CUDA 核函数
-	CUDA_calculationEcho << <numBlocks, blockSize >> > (sigma0, TransAnt, ReciveAnt,
-		localangle, R, slopeangle,
-		nearRange, Fs, pt, lamda, FreqIDmax,
-		echoAmp, FreqID,
-		len);
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-
-
-
-
-
-
-extern "C" void CUDA_RTPC_SiglePRF(
-	float antPx, 	 float antPy, float antPZ,
-	float  antXaxisX, float  antXaxisY, float  antXaxisZ,
-	float  antYaxisX, float  antYaxisY, float  antYaxisZ,
-	float  antZaxisX, float  antZaxisY, float  antZaxisZ,
-	float  antDirectX, float  antDirectY, float  antDirectZ,
-	float* demx, float* demy, float* demz, long* demcls, 
-	float* demslopex, float* demslopey, float* demslopez, float* demslopeangle,
-	float* Tantpattern, float Tstarttheta, float Tstartphi, float Tdtheta, float Tdphi, int Tthetapoints, int Tphipoints,
-	float* Rantpattern, float Rstarttheta, float Rstartphi, float Rdtheta, float Rdphi, int Rthetapoints, int Rphipoints,
-	float lamda, float fs, float nearrange, float Pt, int Freqnumbers, 
-	CUDASigmaParam* sigma0Paramslist, int sigmaparamslistlen,
-	cuComplex* outecho, int* d_echoAmpFID,
-	int linecount,int colcount) {
-	
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (linecount* colcount + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	//printf("\nCUDA_RTPC_SiglePRF blockSize:%d ,numBlock:%d\n",blockSize,numBlocks);
-	// 调用 CUDA 核函数 CUDA_RTPC_Kernel
-
-CUDA_RTPC << <numBlocks, blockSize >> > (
-	antPx, antPy, antPZ,// 天线坐标
-	antXaxisX, antXaxisY, antXaxisZ, // 天线坐标系
-	antYaxisX, antYaxisY, antYaxisZ, //
-	antZaxisX, antZaxisY, antZaxisZ,
-	antDirectX, antDirectY, antDirectZ,// 天线指向
-	demx, demy, demz, 
-	demcls, // 地面坐标
-	demslopex, demslopey, demslopez, demslopeangle,// 地面坡度
-	Tantpattern, Tstarttheta, Tstartphi, Tdtheta, Tdphi, Tthetapoints, Tphipoints,// 天线方向图相关
-	Rantpattern, Rstarttheta, Rstartphi, Rdtheta, Rdphi, Rthetapoints, Rphipoints,// 天线方向图相关
-	lamda, fs, nearrange, Pt, Freqnumbers, // 参数
-	sigma0Paramslist, sigmaparamslistlen,// 地表覆盖类型-sigma插值对应函数-ulaby
-	outecho, d_echoAmpFID,
-	linecount, colcount
-	);
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-
-extern "C" void CUDAInterpSigma(
-	long* demcls,float* sigmaAmp, float* localanglearr,long len,
-	CUDASigmaParam* sigma0Paramslist, long sigmaparamslistlen) {// 地表覆盖类型-sigma插值对应函数-ulaby
-	int blockSize = 256; // 每个块的线程数
-	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
-	// 调用 CUDA 核函数
-	CUDA_InterpSigma << <numBlocks, blockSize >> > (
-		demcls, sigmaAmp, localanglearr, len,
-		sigma0Paramslist, sigmaparamslistlen
-		);
-#ifdef __CUDADEBUG__
-	cudaError_t err = cudaGetLastError();
-	if (err != cudaSuccess) {
-		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
-		// Possibly: exit(-1) if program cannot continue....
-	}
-#endif // __CUDADEBUG__
-	cudaDeviceSynchronize();
-}
-
-
-#endif
-
-
--- a/BaseTool/GPUTool.cuh
+++ b/BaseTool/GPUTool.cuh
@ -1,452 +0,0 @@
-#ifndef GPUTOOL_H
-#define GPUTOOL_H
-#ifdef __CUDANVCC___
-#include "BaseConstVariable.h"
-#include <cuda_runtime.h>
-#include <device_launch_parameters.h>
-#include <cublas_v2.h>
-#include <cuComplex.h>
-
-#define __CUDADEBUG__
-
-// 默认显存分布
-
-
-enum LAMPGPUDATETYPE {
-	LAMP_LONG,
-	LAMP_FLOAT,
-	LAMP_COMPLEXFLOAT
-};
-
-
-extern "C" struct  CUDASigmaParam {
-	float p1;
-	float p2;
-	float p3;
-	float p4;
-	float p5;
-	float p6;
-};
-
-extern "C" struct CUDAVector {
-	float x;
-	float y;
-	float z;
-};
-
-extern "C" struct CUDAVectorEllipsoidal {
-	float theta;
-	float phi;
-	float pho;
-};
-
-
-
-// GPU 内存函数
-extern "C" void* mallocCUDAHost(  long memsize); // 主机内存声明
-extern "C" void FreeCUDAHost(void* ptr);
-extern "C" void* mallocCUDADevice(  long memsize); // GPU内存声明
-extern "C" void FreeCUDADevice(void* ptr);
-extern "C" void HostToDevice(void* hostptr, void* deviceptr, long memsize);//GPU 内存数据转移  设备 -> GPU
-extern "C" void DeviceToHost(void* hostptr, void* deviceptr, long memsize);//GPU 内存数据转移  GPU -> 设备
-
-
-// 仿真所需的常用函数
-extern "C" void distanceAB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* R, long member);
-extern "C" void BdistanceAs(float* Ax, float* Ay, float* Az, float Bx, float By, float Bz, float* R, long member);
-extern "C" void make_VectorA_B(float sX, float sY, float sZ, float* tX, float* tY, float* tZ, float* RstX, float* RstY, float* RstZ, long member);
-extern "C" void Norm_Vector(float* Vx, float* Vy, float* Vz, float* R, long member);
-extern "C" void cosAngle_VA_AB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* anglecos, long len);
-extern "C" void SatelliteAntDirectNormal(float* RstX, float* RstY, float* RstZ, float  antXaxisX, float  antXaxisY, float  antXaxisZ, float  antYaxisX, float  antYaxisY, float  antYaxisZ, float  antZaxisX, float  antZaxisY, float  antZaxisZ, float  antDirectX, float  antDirectY, float  antDirectZ, float* thetaAnt, float* phiAnt, long len);
-
-extern "C" void AntPatternInterpGain(float* anttheta, float* antphi, float* gain, float* antpattern, float starttheta, float startphi, float dtheta, float dphi, int thetapoints, int phipoints,long len);
- 
-extern "C" void CUDA_RTPC_SiglePRF(
-	float antPx, float antPy, float antPZ,
-	float  antXaxisX, float  antXaxisY, float  antXaxisZ,
-	float  antYaxisX, float  antYaxisY, float  antYaxisZ,
-	float  antZaxisX, float  antZaxisY, float  antZaxisZ,
-	float  antDirectX, float  antDirectY, float  antDirectZ,
-	float* demx, float* demy, float* demz, long* demcls,
-	float* demslopex, float* demslopey, float* demslopez, float* demslopeangle,
-	float* Tantpattern, float Tstarttheta, float Tstartphi, float Tdtheta, float Tdphi, int Tthetapoints, int Tphipoints,
-	float* Rantpattern, float Rstarttheta, float Rstartphi, float Rdtheta, float Rdphi, int Rthetapoints, int Rphipoints,
-	float lamda, float fs, float nearrange, float Pt, int Freqnumbers,
-	CUDASigmaParam* sigma0Paramslist, int sigmaparamslistlen,
-	cuComplex* outecho, int* d_echoAmpFID,
-	int linecount, int colcount
-);
-
-extern "C" void CUDARTPCPRF(float antPx, long len);
-extern "C" void CUDATestHelloWorld(float a, long len);
-
-
-extern "C" void CUDATBPImage(
-	float* antPx,
-	float* antPy,
-	float* antPz,
-	float* imgx,
-	float* imgy,
-	float* imgz,
-	cuComplex* echoArr,
-	cuComplex* imgArr,
-	float freq, float fs, float Rnear, float Rfar,
-	long rowcount, long colcount,
-	long prfid, long freqcount
-);
-
-
-extern "C" void calculationEcho(float* sigma0, float* TransAnt, float* ReciveAnt,
-	float* localangle, float* R, float* slopeangle,
-	float nearRange, float Fs, float pt, float lamda, long FreqIDmax,
-	cuComplex* echoAmp, long* FreqID,
-	long len);
-
-
-extern "C" void CUDAInterpSigma(
-	long* demcls, float* sigmaAmp, float* localanglearr, long len,
-	CUDASigmaParam* sigma0Paramslist, long sigmaparamslistlen);
-
-#endif
-#endif
-
-
-
-
-/**
-* 
-
-
-
-	double* databuffer = new double[nXSize * nYSize * 2];
-	poBand->RasterIO(GF_Read, start_col, start_row, cols_count, rows_count, databuffer, cols_count,
-					 rows_count, GDT_CFloat64, 0, 0);
-	GDALClose((GDALDatasetH)poDataset);
-	Eigen::MatrixXcd rasterData(nYSize, nXSize); // 使用Eigen的MatrixXcd
-	for(size_t i = 0; i < nYSize; i++) {
-		for(size_t j = 0; j < nXSize; j++) {
-			rasterData(i, j) = std::complex<double>(databuffer[i * nXSize * 2 + j * 2],
-													databuffer[i * nXSize * 2 + j * 2 + 1]);
-		}
-	}
-
-	delete[] databuffer;
-
-
-
-	gdalImage demxyz(demxyzPath);// 地面点坐标
-	gdalImage demlandcls(this->LandCoverPath);// 地表覆盖类型
-	gdalImage demsloperxyz(this->demsloperPath);// 地面坡向
-
-
-	omp_lock_t lock; // 定义锁
-	omp_init_lock(&lock); // 初始化锁
-	long start_ids = 1250;
-	for (start_ids = 1; start_ids < demxyz.height; start_ids = start_ids + line_invert) {  // 8+ 17 + 0.3 MB
-		QDateTime current = QDateTime::currentDateTime();
-		long pluseStep = Memory1MB * 100 / 3 / PlusePoint;
-		if (pluseStep * num_thread * 3 > this->PluseCount) {
-			pluseStep = this->PluseCount / num_thread / 3;
-		}
-		pluseStep = pluseStep > 50 ? pluseStep : 50;
-
-
-		qDebug() << current.toString("yyyy-MM-dd HH:mm:ss.zzz") << " \tstart \t " << start_ids << " - " << start_ids + line_invert << "\t" << demxyz.height << "\t pluseCount:\t" << pluseStep;
-		// 文件读取
-		Eigen::MatrixXd dem_x = demxyz.getData(start_ids - 1, 0, line_invert + 1, demxyz.width, 1); //
-		Eigen::MatrixXd dem_y = demxyz.getData(start_ids - 1, 0, line_invert + 1, demxyz.width, 2); //
-		Eigen::MatrixXd dem_z = demxyz.getData(start_ids - 1, 0, line_invert + 1, demxyz.width, 3); //
-
-		// 地表覆盖
-		std::shared_ptr<long> dem_landcls = readDataArr<long>(demlandcls, start_ids - 1, 0, line_invert + 1, demxyz.width, 1, GDALREADARRCOPYMETHOD::VARIABLEMETHOD); // 地表覆盖类型
-		long* dem_landcls_ptr = dem_landcls.get();
-		double localAngle = 30.0;
-
-		bool sigmaNoZeroFlag = true;
-		for (long ii = 0; ii < dem_x.rows(); ii++) {
-			for (long jj = 0; jj < dem_y.cols(); jj++) {
-				if (0 != this->SigmaDatabasePtr->getAmp(dem_landcls_ptr[dem_x.cols() * ii + jj], localAngle, polartype)) {
-					sigmaNoZeroFlag = false;
-					break;
-				}
-			}
-			if (!sigmaNoZeroFlag) {
-				break;
-			}
-		}
-		if (sigmaNoZeroFlag) {
-			continue;
-		}
-
-		//#ifdef DEBUGSHOWDIALOG
-		//		dialog->load_double_MatrixX_data(dem_z, "dem_z");
-		//#endif
-
-
-		Eigen::MatrixXd demsloper_x = demsloperxyz.getData(start_ids - 1, 0, line_invert + 1, demxyz.width, 1); //
-		Eigen::MatrixXd demsloper_y = demsloperxyz.getData(start_ids - 1, 0, line_invert + 1, demxyz.width, 2); //
-		Eigen::MatrixXd demsloper_z = demsloperxyz.getData(start_ids - 1, 0, line_invert + 1, demxyz.width, 3); //
-		Eigen::MatrixXd sloperAngle = demsloperxyz.getData(start_ids - 1, 0, line_invert + 1, demxyz.width, 4); //
-		sloperAngle = sloperAngle.array() * T180_PI;
-
-		long dem_rows = dem_x.rows();
-		long dem_cols = dem_x.cols();
-
-		long freqidx = 0;//
-
-
-
-#ifdef DEBUGSHOWDIALOG
-		ImageShowDialogClass* dialog = new ImageShowDialogClass(nullptr);
-		dialog->show();
-
-		Eigen::MatrixXd landaArr = Eigen::MatrixXd::Zero(dem_rows, dem_cols);
-		for (long i = 0; i < dem_rows; i++) {
-			for (long j = 0; j < dem_cols; j++) {
-				landaArr(i, j) = dem_landcls.get()[i * dem_cols + j];
-			}
-		}
-		dialog->load_double_MatrixX_data(landaArr, "landCover");
-#endif
-		//qDebug() << " pluse bolck size :\t " << pluseStep << " all size:\t" << this->PluseCount;
-		long processNumber = 0;
-
-#pragma omp parallel for
-		for (long startprfidx = 0; startprfidx < this->PluseCount; startprfidx = startprfidx + pluseStep) { // 17 + 0.3 MB
-			long prfcount_step = startprfidx + pluseStep < this->PluseCount ? pluseStep : this->PluseCount - startprfidx;
-			Eigen::MatrixXcd echoPluse = Eigen::MatrixXcd::Zero(prfcount_step, PlusePoint); // 当前脉冲的回波积分情况
-			// 内存预分配
-			Eigen::MatrixXd Rst_x = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd Rst_y = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd Rst_z = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd R = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd localangle = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd Vst_x = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd Vst_y = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd Vst_z = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd fde = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd fr = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd Rx = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd sigam = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd echoAmp = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols()).array() + Pt;
-			Eigen::MatrixXd Rphi = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd TimeRange = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd TransAnt = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd ReciveAnt = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-
-			Eigen::MatrixXd AntTheta = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-			Eigen::MatrixXd AntPhi = Eigen::MatrixXd::Zero(dem_x.rows(), dem_x.cols());
-
-			double minR = 0, maxR = 0;
-			double minLocalAngle = 0, maxLocalAngle = 0;
-
-			Vector3D Rt = { 0,0,0 };
-			SatelliteOribtNode oRs = SatelliteOribtNode{ 0 };;
-
-			Vector3D	p0 = {}, slopeVector = {}, sateAntDirect = {};
-			Vector3D	Rs = {}, Vs = {}, Ast = {};
-			SatelliteAntDirect antdirectNode = {};
-			std::complex<double> echofreq;
-			std::complex<double> Imag1(0, 1);
-			double TAntPattern = 1;	// 发射天线方向图
-			double RAntPanttern = 1;// 接收天线方向图
-			double maxechoAmp = 1;
-			double tempAmp = 1;
-			for (long prfidx = 0; prfidx < prfcount_step; prfidx++)
-			{
-				oRs = sateOirbtNodes[prfidx + startprfidx];
-
-				// 计算天线方向图
-				for (long jj = 1; jj < dem_cols - 1; jj++) {
-					for (long ii = 1; ii < dem_rows - 1; ii++) {
-						p0.x = dem_x(ii, jj);
-						p0.y = dem_y(ii, jj);
-						p0.z = dem_z(ii, jj);
-						this->TaskSetting->getSatelliteAntDirectNormal(oRs, p0, antdirectNode);
-						//antdirectNode.ThetaAnt = antdirectNode.ThetaAnt * r2d;
-						//antdirectNode.PhiAnt = antdirectNode.PhiAnt * r2d;
-						AntTheta(ii, jj) = antdirectNode.ThetaAnt * r2d;
-						AntPhi(ii, jj) = antdirectNode.PhiAnt * r2d;
-					}
-				}
-
-				// 计算发射天线方向图
-				for (long jj = 1; jj < dem_cols - 1; jj++) {
-					for (long ii = 1; ii < dem_rows - 1; ii++) {
-						TransformPattern->getGainLinear(AntTheta(ii, jj), AntPhi(ii, jj), TransAnt(ii, jj));
-						//TransAnt(ii, jj) = TAntPattern;
-					}
-				}
-
-				// 计算接收天线方向图
-				for (long jj = 1; jj < dem_cols - 1; jj++) {
-					for (long ii = 1; ii < dem_rows - 1; ii++) {
-						TransformPattern->getGainLinear(AntTheta(ii, jj), AntPhi(ii, jj), ReciveAnt(ii, jj));
-						//ReciveAnt(ii, jj) = RAntPanttern;
-					}
-				}
-
-				// 计算经过增益的能量
-				echoAmp = Pt * TransAnt.array() * ReciveAnt.array();
-
-				maxechoAmp = echoAmp.maxCoeff();
-				if (std::abs(maxechoAmp) < PRECISIONTOLERANCE) { // 这种情况下，不在合成孔径范围中
-					continue;
-				}
-
-				Rs.x = sateOirbtNodes[prfidx + startprfidx].Px; // 卫星位置
-				Rs.y = sateOirbtNodes[prfidx + startprfidx].Py;
-				Rs.z = sateOirbtNodes[prfidx + startprfidx].Pz;
-
-				Vs.x = sateOirbtNodes[prfidx + startprfidx].Vx; // 卫星速度
-				Vs.y = sateOirbtNodes[prfidx + startprfidx].Vy;
-				Vs.z = sateOirbtNodes[prfidx + startprfidx].Vz;
-
-				Ast.x = sateOirbtNodes[prfidx + startprfidx].AVx;// 卫星加速度
-				Ast.y = sateOirbtNodes[prfidx + startprfidx].AVy;
-				Ast.z = sateOirbtNodes[prfidx + startprfidx].AVz;
-
-				Rst_x = Rs.x - dem_x.array(); //  Rst = Rs - Rt;
-				Rst_y = Rs.y - dem_y.array();
-				Rst_z = Rs.z - dem_z.array();
-				R = (Rst_x.array().pow(2) + Rst_y.array().pow(2) + Rst_z.array().pow(2)).array().sqrt(); // R
-
-				minR = R.minCoeff();
-				maxR = R.maxCoeff();
-				//qDebug() << "minR:\t" << minR << "  maxR:\t" << maxR;
-				if (maxR<NearRange || minR>FarRange) {
-					continue;
-				}
-				else {}
-
-				// getCosAngle
-				// double c = dot(a, b) / (getlength(a) * getlength(b));
-				// return acos(c > 1 ? 1 : c < -1 ? -1 : c) * r2d;
-				// localangle = getCosAngle(Rst, slopeVector) * T180_PI; // 注意这个只能实时计算，因为非实时计算代价太大
-				localangle = (Rst_x.array() * demsloper_x.array() + Rst_y.array() * demsloper_y.array() + Rst_z.array() * demsloper_z.array()).array(); // dot(a, b)
-				localangle = localangle.array() / R.array();
-				localangle = localangle.array() / (demsloper_x.array().pow(2) + demsloper_y.array().pow(2) + demsloper_z.array().pow(2)).array().sqrt().array();
-				localangle = localangle.array().acos(); // 弧度值
-
-				minLocalAngle = localangle.minCoeff();
-				maxLocalAngle = localangle.maxCoeff();
-				if (maxLocalAngle<0 || minLocalAngle>PI / 2) {
-					continue;
-				}
-				else {}
-
-				//Vst_x = Vs.x + 1 * earthRoute * dem_y.array(); // Vst = Vs - Vt;
-				//Vst_y = Vs.y - 1 * earthRoute * dem_x.array();
-				//Vst_z = Vs.z - Eigen::MatrixXd::Zero(dem_x.rows(), dem_y.cols()).array();
-
-				//// 计算多普勒中心频率 Rst, Vst : ( - 2 / lamda) * dot(Rs - Rt, Vs - Vt) / R; // 星载合成孔径雷达原始回波数据模拟研究 3.18
-				//fde = (-2 / lamda) * (Rst_x.array() * Vst_x.array() + Rst_y.array() * Vst_y.array() + Rst_z.array() * Vst_z.array()).array() / (R.array());
-				//// 计算多普勒频率斜率   // 星载合成孔径雷达原始回波数据模拟研究 3.19
-				//// -(2/lamda)*(  dot(Vs - Vt, Vs - Vt)/R  +   dot(Ast, Rs - Rt)/R  - std::pow(dot(Vs - Vt, Rs - Rt),2 )/std::pow(R,3));
-				//fr = (-2 / lamda) *
-				//	(Vst_x.array() * Vst_x.array() + Vst_y.array() * Vst_y.array() + Vst_z.array() * Vst_z.array()).array() / (R.array()) +
-				//	(-2 / lamda) *
-				//	(Ast.x * Rst_x.array() + Ast.y * Rst_y.array() + Ast.z * Rst_z.array()).array() / (R.array()) -
-				//	(-2 / lamda) *
-				//	(Vst_x.array() * Rst_x.array() + Vst_y.array() * Rst_y.array() + Vst_z.array() * Rst_z.array()).array().pow(2) / (R.array().pow(3));
-				// 计算回波
-				Rx = R;//  -(lamda / 2) * (fde * TRx + 0.5 * fr * TRx * TRx); // 斜距历程值
-
-
-				// 逐点计算 this->SigmaDatabasePtr->getAmp(covercls, localangle, polartype); // 后向散射系数 HH
-
-				for (long ii = 0; ii < dem_x.rows(); ii++) {
-					for (long jj = 0; jj < dem_y.cols(); jj++) {
-						sigam(ii, jj) = this->SigmaDatabasePtr->getAmp(dem_landcls_ptr[dem_x.cols() * ii + jj], localangle(ii, jj) * r2d, polartype);
-					}
-				}
-
-				if (sigam.maxCoeff() > 0) {}
-				else {
-					continue;
-				}
-				// projArea = 1 / std::cos(sloperAngle) * std::sin(localangle); // 投影面积系数，单位投影面积 1m x 1m --注意这里是假设，后期再补充
-				// echoAmp =  projArea*TAntPattern * RAntPanttern * sigam  / (4 * PI * R * R);
-
-				echoAmp = echoAmp.array() * sigam.array() * (1 / sloperAngle.array().cos() * localangle.array().sin());  // 反射强度
-				echoAmp = echoAmp.array() / (4 * PI * R.array().pow(2));				// 距离衰减
-
-				Rphi = -4 * PI / lamda * Rx.array();// 距离徙动相位
-				// 积分
-				TimeRange = ((2 * R.array() / LIGHTSPEED - TimgNearRange).array() * Fs).array();
-				double localAnglepoint = -1;
-				long prf_freq_id = 0;
-
-
-				for (long jj = 1; jj < dem_cols - 1; jj++) {
-					for (long ii = 1; ii < dem_rows - 1; ii++) {
-						prf_freq_id = std::floor(TimeRange(ii, jj));
-						if (prf_freq_id < 0 || prf_freq_id >= PlusePoint || localangle(ii, jj) < 0 || localangle(ii, jj) > PI / 2 || echoAmp(ii, jj) == 0) {
-							continue;
-						}
-						echofreq = echoAmp(ii, jj) * std::exp(Rphi(ii, jj) * Imag1);
-						echoPluse(prfidx, prf_freq_id) = echoPluse(prfidx, prf_freq_id) + echofreq;
-					}
-				}
-
-#ifdef DEBUGSHOWDIALOG
-				ImageShowDialogClass* localangledialog = new ImageShowDialogClass(dialog);
-				localangledialog->show();
-				localangledialog->load_double_MatrixX_data(localangle.array() * r2d, "localangle");
-
-
-				ImageShowDialogClass* sigamdialog = new ImageShowDialogClass(dialog);
-				sigamdialog->show();
-				sigamdialog->load_double_MatrixX_data(TimeRange, "TimeRange");
-
-
-				ImageShowDialogClass* ampdialog = new ImageShowDialogClass(dialog);
-				ampdialog->show();
-				ampdialog->load_double_MatrixX_data(echoAmp, "echoAmp");
-
-				Eigen::MatrixXd echoPluseamp = echoPluse.array().abs().cast<double>().array();
-				ImageShowDialogClass* echoampdialog = new ImageShowDialogClass(dialog);
-				echoampdialog->show();
-				echoampdialog->load_double_MatrixX_data(echoPluseamp, "echoPluseamp");
-
-
-				dialog->exec();
-#endif
-				//qDebug() << QDateTime::currentDateTime().toString("yyyy-MM-dd HH:mm:ss.zzz") << " end  " << prfidx;
-			}
-			//qDebug() << QDateTime::currentDateTime().toString("yyyy-MM-dd HH:mm:ss.zzz")<<" step "<< prfcount_step;
-
-			omp_set_lock(&lock); // 回波整体赋值处理
-			for (long prfidx = 0; prfidx < prfcount_step; prfidx++) {
-				for (long freqidx = 0; freqidx < PlusePoint; freqidx++)
-				{
-					//qDebug() << prfidx << "  " << freqidx << "  " << echoPluse(prfidx, freqidx).real() << " + " << echoPluse(prfidx, freqidx).imag() << "  j";
-					echo.get()[(prfidx + startprfidx) * PlusePoint + freqidx] = echo.get()[(prfidx + startprfidx) * PlusePoint + freqidx] + echoPluse(prfidx, freqidx);
-				}
-			}
-			//this->EchoSimulationData->saveEchoArr(echo, 0, PluseCount);
-			omp_unset_lock(&lock); // 解锁
-			//qDebug() << QDateTime::currentDateTime().toString("yyyy-MM-dd HH:mm:ss.zzz") << " step 2" << prfcount_step;
-		}
-
-		omp_set_lock(&lock); // 保存文件
-		processNumber = processNumber + pluseStep;
-
-		this->EchoSimulationData->saveEchoArr(echo, 0, PluseCount);
-		omp_unset_lock(&lock); // 解锁
-
-		qDebug() << QDateTime::currentDateTime().toString("yyyy-MM-dd HH:mm:ss.zzz") << "  \t " << start_ids << "\t--\t " << start_ids + line_invert << "\t/\t" << demxyz.height;
-
-	}
-	omp_destroy_lock(&lock); // 销毁锁
-
-
-
-
-
-
-
-
-
-
-*/
--- a/GPUTool/GPURTPC.cu
+++ b/GPUTool/GPURTPC.cu
@ -0,0 +1,464 @@
+
+
+#include <iostream>
+#include <memory>
+#include <cmath>
+#include <complex>
+#include <device_launch_parameters.h>
+#include <cuda_runtime.h>
+#include <cublas_v2.h>
+#include <cuComplex.h>
+
+#include "BaseConstVariable.h"
+#include "GPURTPC.cuh"
+
+#ifdef __CUDANVCC___
+
+
+__device__ float GPU_getSigma0dB(CUDASigmaParam param, float theta) {//线性值
+	float sigma= param.p1 + param.p2 * exp(-param.p3 * theta) + param.p4 * cos(param.p5 * theta + param.p6);
+	return  sigma;
+}
+
+
+__device__ CUDAVectorEllipsoidal GPU_SatelliteAntDirectNormal(float RstX, float RstY, float RstZ,
+	float  antXaxisX, float  antXaxisY, float  antXaxisZ,
+	float  antYaxisX, float  antYaxisY, float  antYaxisZ,
+	float  antZaxisX, float  antZaxisY, float  antZaxisZ,
+	float  antDirectX, float  antDirectY, float  antDirectZ
+) {
+	CUDAVectorEllipsoidal result{ 0,0,-1 };
+	float Xst = -1 * RstX; // 卫星 -->  地面
+	float Yst = -1 * RstY;
+	float Zst = -1 * RstZ;
+	float AntXaxisX = antXaxisX;
+	float AntXaxisY = antXaxisY;
+	float AntXaxisZ = antXaxisZ;
+	float AntYaxisX = antYaxisX;
+	float AntYaxisY = antYaxisY;
+	float AntYaxisZ = antYaxisZ;
+	float AntZaxisX = antZaxisX;
+	float AntZaxisY = antZaxisY;
+	float AntZaxisZ = antZaxisZ;
+	// 天线指向在天线坐标系下的值
+	float Xant = (Xst * (AntYaxisY * AntZaxisZ - AntYaxisZ * AntZaxisY) + Xst * (AntXaxisZ * AntZaxisY - AntXaxisY * AntZaxisZ) + Xst * (AntXaxisY * AntYaxisZ - AntXaxisZ * AntYaxisY)) / (AntXaxisX * (AntYaxisY * AntZaxisZ - AntZaxisY * AntYaxisZ) - AntYaxisX * (AntXaxisY * AntZaxisZ - AntXaxisZ * AntZaxisY) + AntZaxisX * (AntXaxisY * AntYaxisZ - AntXaxisZ * AntYaxisY));
+	float Yant = (Yst * (AntYaxisZ * AntZaxisX - AntYaxisX * AntZaxisZ) + Yst * (AntXaxisX * AntZaxisZ - AntXaxisZ * AntZaxisX) + Yst * (AntYaxisX * AntXaxisZ - AntXaxisX * AntYaxisZ)) / (AntXaxisX * (AntYaxisY * AntZaxisZ - AntZaxisY * AntYaxisZ) - AntYaxisX * (AntXaxisY * AntZaxisZ - AntXaxisZ * AntZaxisY) + AntZaxisX * (AntXaxisY * AntYaxisZ - AntXaxisZ * AntYaxisY));
+	float Zant = (Zst * (AntYaxisX * AntZaxisY - AntYaxisY * AntZaxisX) + Zst * (AntXaxisY * AntZaxisX - AntXaxisX * AntZaxisY) + Zst * (AntXaxisX * AntYaxisY - AntYaxisX * AntXaxisY)) / (AntXaxisX * (AntYaxisY * AntZaxisZ - AntZaxisY * AntYaxisZ) - AntYaxisX * (AntXaxisY * AntZaxisZ - AntXaxisZ * AntZaxisY) + AntZaxisX * (AntXaxisY * AntYaxisZ - AntXaxisZ * AntYaxisY));
+	// 计算theta 与 phi
+	float Norm = sqrtf(Xant * Xant + Yant * Yant + Zant * Zant); // 计算 pho
+	float ThetaAnt = acosf(Zant / Norm); // theta 与 Z轴的夹角
+	float YsinTheta = Yant / sinf(ThetaAnt);
+	float PhiAnt = (YsinTheta / abs(YsinTheta)) * acosf(Xant / (Norm * sinf(ThetaAnt)));
+	result.theta = ThetaAnt;
+	result.phi = PhiAnt;
+	result.pho = Norm;
+	return result;
+}
+
+__device__ float GPU_BillerInterpAntPattern(float* antpattern,
+	float starttheta, float startphi, float dtheta, float dphi,
+	long thetapoints, long phipoints,
+	float searththeta, float searchphi) {
+	float stheta = searththeta;
+	float sphi = searchphi;
+	if (stheta > 90) {
+		return 0;
+	}
+	else {}
+
+
+	float pthetaid = (stheta - starttheta) / dtheta;// 
+	float pphiid = (sphi - startphi) / dphi;
+
+	long lasttheta = floorf(pthetaid);
+	long nextTheta = lasttheta + 1;
+	long lastphi = floorf(pphiid);
+	long nextPhi = lastphi + 1;
+ 
+
+	if (lasttheta < 0 || nextTheta < 0 || lastphi < 0 || nextPhi < 0 ||
+		lasttheta >= thetapoints || nextTheta >= thetapoints || lastphi >= phipoints || nextPhi >= phipoints)
+	{
+		return 0;
+	}
+	else {
+		float x = stheta;
+		float y = sphi;
+
+		float x1 = lasttheta * dtheta + starttheta;
+		float x2 = nextTheta * dtheta + starttheta;
+		float y1 = lastphi * dphi + startphi;
+		float y2 = nextPhi * dphi + startphi;
+
+		float z11 = antpattern[lasttheta * phipoints + lastphi];
+		float z12 = antpattern[lasttheta * phipoints + nextPhi];
+		float z21 = antpattern[nextTheta * phipoints + lastphi];
+		float z22 = antpattern[nextTheta * phipoints + nextPhi];
+
+
+		//z11 = powf(10, z11 / 10); // dB-> 线性
+		//z12 = powf(10, z12 / 10);
+		//z21 = powf(10, z21 / 10);
+		//z22 = powf(10, z22 / 10);
+
+		float GainValue = (z11 * (x2 - x) * (y2 - y)
+			+ z21 * (x - x1) * (y2 - y)
+			+ z12 * (x2 - x) * (y - y1)
+			+ z22 * (x - x1) * (y - y1));
+		GainValue = GainValue / ((x2 - x1) * (y2 - y1));
+		return GainValue;
+	}
+}
+
+__device__ cuComplex  GPU_calculationEcho(float sigma0, float TransAnt, float ReciveAnt,
+	float localangle, float R, float slopeangle, float Pt, float lamda) {
+	float r = R;
+	float amp = Pt * TransAnt * ReciveAnt;
+	amp = amp * sigma0;
+	amp = amp / (powf(4 * LAMP_CUDA_PI, 2) * powf(r, 4)); // 反射强度
+	float phi = (-4 * LAMP_CUDA_PI / lamda) * r;
+	cuComplex echophi = make_cuComplex(0, phi);
+	cuComplex echophiexp = cuCexpf(echophi);
+	cuComplex echo;
+	echo.x = echophiexp.x * amp;
+	echo.y = echophiexp.y * amp;
+	return echo;
+}
+
+
+__global__ void CUDA_SatelliteAntDirectNormal(float* RstX, float* RstY, float* RstZ,
+	float  antXaxisX, float  antXaxisY, float  antXaxisZ,
+	float  antYaxisX, float  antYaxisY, float  antYaxisZ,
+	float  antZaxisX, float  antZaxisY, float  antZaxisZ,
+	float  antDirectX, float  antDirectY, float  antDirectZ,
+	float* thetaAnt, float* phiAnt
+	, long len) {
+	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
+	if (idx < len) {
+		float Xst		= -1 * RstX[idx]; // 卫星 -->  地面
+		float Yst		= -1 * RstY[idx];
+		float Zst		= -1 * RstZ[idx];
+		float AntXaxisX = antXaxisX;
+		float AntXaxisY = antXaxisY;
+		float AntXaxisZ = antXaxisZ;
+		float AntYaxisX = antYaxisX;
+		float AntYaxisY = antYaxisY;
+		float AntYaxisZ = antYaxisZ;
+		float AntZaxisX = antZaxisX;
+		float AntZaxisY = antZaxisY;
+		float AntZaxisZ = antZaxisZ;
+
+		// 归一化
+		float RstNorm		= sqrtf(Xst * Xst + Yst * Yst + Zst * Zst);
+		float AntXaxisNorm = sqrtf(AntXaxisX * AntXaxisX + AntXaxisY * AntXaxisY + AntXaxisZ * AntXaxisZ);
+		float AntYaxisNorm = sqrtf(AntYaxisX * AntYaxisX + AntYaxisY * AntYaxisY + AntYaxisZ * AntYaxisZ);
+		float AntZaxisNorm = sqrtf(AntZaxisX * AntZaxisX + AntZaxisY * AntZaxisY + AntZaxisZ * AntZaxisZ);
+
+
+		float Rx = Xst / RstNorm;
+		float Ry = Yst / RstNorm;
+		float Rz = Zst / RstNorm;
+		float Xx = AntXaxisX / AntXaxisNorm;
+		float Xy = AntXaxisY / AntXaxisNorm;
+		float Xz = AntXaxisZ / AntXaxisNorm;
+		float Yx = AntYaxisX / AntYaxisNorm;
+		float Yy = AntYaxisY / AntYaxisNorm;
+		float Yz = AntYaxisZ / AntYaxisNorm;
+		float Zx = AntZaxisX / AntZaxisNorm;
+		float Zy = AntZaxisY / AntZaxisNorm;
+		float Zz = AntZaxisZ / AntZaxisNorm;
+
+		float Xant =	(Rx * Yy * Zz - Rx * Yz * Zy - Ry * Yx * Zz + Ry * Yz * Zx + Rz * Yx * Zy - Rz * Yy * Zx) / (Xx * Yy * Zz - Xx * Yz * Zy - Xy * Yx * Zz + Xy * Yz * Zx + Xz * Yx * Zy - Xz * Yy * Zx);
+		float Yant =	-(Rx * Xy * Zz - Rx * Xz * Zy - Ry * Xx * Zz + Ry * Xz * Zx + Rz * Xx * Zy - Rz * Xy * Zx) / (Xx * Yy * Zz - Xx * Yz * Zy - Xy * Yx * Zz + Xy * Yz * Zx + Xz * Yx * Zy - Xz * Yy * Zx);
+		float Zant =	(Rx * Xy * Yz - Rx * Xz * Yy - Ry * Xx * Yz + Ry * Xz * Yx + Rz * Xx * Yy - Rz * Xy * Yx) / (Xx * Yy * Zz - Xx * Yz * Zy - Xy * Yx * Zz + Xy * Yz * Zx + Xz * Yx * Zy - Xz * Yy * Zx);
+ 
+		
+		// 计算theta 与 phi
+		float Norm = sqrtf(Xant * Xant + Yant * Yant + Zant * Zant); // 计算 pho
+		float ThetaAnt = acosf(Zant / Norm); // theta 与 Z轴的夹角
+		float PhiAnt = atanf(Yant / Xant); // -pi/2 ~pi/2
+
+
+		if (abs(Yant) < PRECISIONTOLERANCE) { // X轴上
+			PhiAnt = 0;
+		}
+		else if (abs(Xant) < PRECISIONTOLERANCE) { // Y轴上，原点
+			if (Yant > 0) {
+				PhiAnt = PI / 2;
+			}
+			else {
+				PhiAnt = -PI / 2;
+			}
+		}
+		else if (Xant < 0) {
+			if (Yant > 0) {
+				PhiAnt = PI + PhiAnt;
+			}
+			else {
+				PhiAnt = -PI+PhiAnt ;
+			}
+		}
+		else {  // Xant>0  X 正轴
+
+		}
+
+		if (isnan(PhiAnt)) {
+			printf("V=[%f,%f,%f];norm=%f;thetaAnt=%f;phiAnt=%f;\n", Xant, Yant, Zant,Norm, ThetaAnt, PhiAnt);
+		}
+
+		//if (abs(ThetaAnt - 0) < PRECISIONTOLERANCE) {
+		//	PhiAnt = 0;
+		//}
+		//else {}
+
+
+		thetaAnt[idx] = ThetaAnt*r2d;
+		phiAnt[idx] = PhiAnt*r2d;
+		//printf("Rst=[%f,%f,%f];AntXaxis = [%f, %f, %f];AntYaxis=[%f,%f,%f];AntZaxis=[%f,%f,%f];phiAnt=%f;thetaAnt=%f;\n", Xst, Yst, Zst
+		//	, AntXaxisX, AntXaxisY, AntXaxisZ
+		//	, AntYaxisX, AntYaxisY, AntYaxisZ
+		//	, AntZaxisX, AntZaxisY, AntZaxisZ
+		//	, phiAnt[idx]
+		//	, thetaAnt[idx]
+		//);
+	}
+}
+
+__global__ void CUDA_BillerInterpAntPattern(float* antpattern,
+	float starttheta, float startphi, float dtheta, float dphi,
+	long thetapoints, long phipoints,
+	float* searththeta, float* searchphi, float* searchantpattern,
+	long len) {
+	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
+	if (idx < len) {
+		float stheta = searththeta[idx];
+		float sphi = searchphi[idx];
+		float pthetaid = (stheta - starttheta) / dtheta;// 
+		float pphiid = (sphi - startphi) / dphi;
+
+		long lasttheta = floorf(pthetaid);
+		long nextTheta = lasttheta + 1;
+		long lastphi = floorf(pphiid);
+		long nextPhi = lastphi + 1;
+
+		if (lasttheta < 0 || nextTheta < 0 || lastphi < 0 || nextPhi < 0 ||
+			lasttheta >= thetapoints || nextTheta >= thetapoints || lastphi >= phipoints || nextPhi >= phipoints)
+		{
+			searchantpattern[idx] = 0;
+		}
+		else {
+			float x = stheta;
+			float y = sphi;
+
+			float x1 = lasttheta * dtheta + starttheta;
+			float x2 = nextTheta * dtheta + starttheta;
+			float y1 = lastphi * dphi + startphi;
+			float y2 = nextPhi * dphi + startphi;
+
+			float z11 = antpattern[lasttheta * phipoints + lastphi];
+			float z12 = antpattern[lasttheta * phipoints + nextPhi];
+			float z21 = antpattern[nextTheta * phipoints + lastphi];
+			float z22 = antpattern[nextTheta * phipoints + nextPhi];
+
+
+			z11 = powf(10, z11 / 10);
+			z12 = powf(10, z12 / 10);
+			z21 = powf(10, z21 / 10);
+			z22 = powf(10, z22 / 10);
+
+			float GainValue = (z11 * (x2 - x) * (y2 - y)
+				+ z21 * (x - x1) * (y2 - y)
+				+ z12 * (x2 - x) * (y - y1)
+				+ z22 * (x - x1) * (y - y1));
+			GainValue = GainValue / ((x2 - x1) * (y2 - y1));
+			searchantpattern[idx] = GainValue;
+		}
+	}
+}
+
+__global__ void CUDA_calculationEcho(float* sigma0, float* TransAnt, float* ReciveAnt,
+	float* localangle, float* R, float* slopeangle,
+	float nearRange, float Fs, float Pt, float lamda, long FreqIDmax,
+	cuComplex* echoArr, long* FreqID,
+	long len) {
+	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
+	if (idx < len) {
+		float r = R[idx];
+		float amp = Pt * TransAnt[idx] * ReciveAnt[idx];
+		amp = amp * sigma0[idx];
+		amp = amp / (powf(4 * LAMP_CUDA_PI, 2) * powf(r, 4)); // 反射强度
+
+		// 处理相位
+		float phi = (-4 * LAMP_CUDA_PI / lamda) * r;
+		cuComplex echophi = make_cuComplex(0, phi);
+		cuComplex echophiexp = cuCexpf(echophi);
+
+		float timeR = 2 * (r - nearRange) / LIGHTSPEED * Fs;
+		long timeID = floorf(timeR);
+		if (timeID < 0 || timeID >= FreqIDmax) {
+			timeID = 0;
+			amp = 0;
+		}
+
+		cuComplex echo;
+		echo.x = echophiexp.x * amp;
+		echo.y = echophiexp.y * amp;
+		echoArr[idx] = echo;
+		FreqID[idx] = timeID;
+	}
+}
+
+
+__global__ void CUDA_AntPatternInterpGain(float* anttheta, float* antphi, float* gain,
+	float* antpattern, float starttheta, float startphi, float dtheta, float dphi, int thetapoints, int phipoints, long len) {
+	int  idx = blockIdx.x * blockDim.x + threadIdx.x;
+ 
+	if (idx < len) {
+
+		float temptheta = anttheta[idx];
+		float tempphi = antphi[idx];
+		
+
+		float antPatternGain =  GPU_BillerInterpAntPattern(antpattern,
+			starttheta, startphi, dtheta, dphi, thetapoints, phipoints,
+			temptheta, tempphi) ;
+		gain[idx] = antPatternGain;
+	}
+}
+
+
+__global__ void CUDA_InterpSigma(
+	long* demcls, float* sigmaAmp, float* localanglearr, long len,
+	CUDASigmaParam* sigma0Paramslist, long sigmaparamslistlen) {
+	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
+	if (idx < len) {
+		long clsid = demcls[idx];
+		float localangle = localanglearr[idx];
+		CUDASigmaParam tempsigma = sigma0Paramslist[clsid];
+		//printf("cls:%d;localangle=%f;\n",clsid, localangle);
+
+		if (localangle < 0 || localangle >= 90) {
+			sigmaAmp[idx] = 0;
+		}
+		else {}
+
+		if (abs(tempsigma.p1)< PRECISIONTOLERANCE&&
+			abs(tempsigma.p2) < PRECISIONTOLERANCE &&
+			abs(tempsigma.p3) < PRECISIONTOLERANCE &&
+			abs(tempsigma.p4) < PRECISIONTOLERANCE&&
+			abs(tempsigma.p5) < PRECISIONTOLERANCE&&
+			abs(tempsigma.p6) < PRECISIONTOLERANCE
+			) {
+			sigmaAmp[idx] = 0;
+		}
+		else {
+			float sigma = GPU_getSigma0dB(tempsigma, localangle);
+			sigma = powf(10.0, sigma / 10.0);// 后向散射系数
+			//printf("cls:%d;localangle=%f;sigma0=%f;\n", clsid, localangle, sigma);
+			sigmaAmp[idx] = sigma;
+		}
+	}
+}
+
+
+
+extern "C" void SatelliteAntDirectNormal(float* RstX, float* RstY, float* RstZ,
+	float  antXaxisX, float  antXaxisY, float  antXaxisZ,
+	float  antYaxisX, float  antYaxisY, float  antYaxisZ,
+	float  antZaxisX, float  antZaxisY, float  antZaxisZ,
+	float  antDirectX, float  antDirectY, float  antDirectZ,
+	float* thetaAnt, float* phiAnt
+	, long len) {
+
+	int blockSize = 256; // 每个块的线程数
+	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
+	// 调用 CUDA 核函数
+	CUDA_SatelliteAntDirectNormal << <numBlocks, blockSize >> > (RstX, RstY, RstZ,
+		antXaxisX, antXaxisY, antXaxisZ,
+		antYaxisX, antYaxisY, antYaxisZ,
+		antZaxisX, antZaxisY, antZaxisZ,
+		antDirectX, antDirectY, antDirectZ,
+		thetaAnt, phiAnt
+		, len);
+
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+
+}
+
+extern "C" void   AntPatternInterpGain(float* anttheta, float* antphi, float* gain,
+	float* antpattern, float starttheta, float startphi, float dtheta, float dphi, int thetapoints, int phipoints, long len) {
+	int blockSize = 256; // 每个块的线程数
+	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
+	//printf("\nCUDA_RTPC_SiglePRF blockSize:%d ,numBlock:%d\n", blockSize, numBlocks);
+
+	CUDA_AntPatternInterpGain << <numBlocks, blockSize >> > ( anttheta,antphi, gain,
+		 antpattern, 
+		 starttheta,  startphi,  dtheta,  dphi,  thetapoints,  phipoints,
+		len);
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+ 
+
+extern "C" void calculationEcho(float* sigma0, float* TransAnt, float* ReciveAnt,
+	float* localangle, float* R, float* slopeangle,
+	float nearRange, float Fs, float pt, float lamda, long FreqIDmax,
+	cuComplex* echoAmp, long* FreqID,
+	long len)
+{
+	int blockSize = 256; // 每个块的线程数
+	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
+	// 调用 CUDA 核函数
+	CUDA_calculationEcho << <numBlocks, blockSize >> > (sigma0, TransAnt, ReciveAnt,
+		localangle, R, slopeangle,
+		nearRange, Fs, pt, lamda, FreqIDmax,
+		echoAmp, FreqID,
+		len);
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+
+extern "C" void CUDAInterpSigma(
+	long* demcls,float* sigmaAmp, float* localanglearr,long len,
+	CUDASigmaParam* sigma0Paramslist, long sigmaparamslistlen) {// 地表覆盖类型-sigma插值对应函数-ulaby
+	int blockSize = 256; // 每个块的线程数
+	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
+	// 调用 CUDA 核函数
+	CUDA_InterpSigma << <numBlocks, blockSize >> > (
+		demcls, sigmaAmp, localanglearr, len,
+		sigma0Paramslist, sigmaparamslistlen
+		);
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+
+#endif
+
+
--- a/GPUTool/GPURTPC.cuh
+++ b/GPUTool/GPURTPC.cuh
@ -0,0 +1,47 @@
+#ifndef _GPURTPC_H_
+#define _GPURTPC_H_
+
+#include "BaseConstVariable.h"
+#include "GPUTool.cuh"
+#include <cuda_runtime.h>
+#include <device_launch_parameters.h>
+#include <cublas_v2.h>
+#include <cuComplex.h>
+
+
+extern "C" struct  CUDASigmaParam {
+	float p1;
+	float p2;
+	float p3;
+	float p4;
+	float p5;
+	float p6;
+};
+
+extern "C" void SatelliteAntDirectNormal(float* RstX, float* RstY, float* RstZ, 
+	float  antXaxisX, float  antXaxisY, float  antXaxisZ, 
+	float  antYaxisX, float  antYaxisY, float  antYaxisZ, 
+	float  antZaxisX, float  antZaxisY, float  antZaxisZ, 
+	float  antDirectX, float  antDirectY, float  antDirectZ, 
+	float* thetaAnt, float* phiAnt, long len);
+
+extern "C" void AntPatternInterpGain(float* anttheta, float* antphi, float* gain, 
+	float* antpattern, 
+	float starttheta, float startphi, float dtheta, float dphi, int thetapoints, int phipoints,
+	long len);
+
+extern "C" void calculationEcho(float* sigma0, float* TransAnt, float* ReciveAnt,
+	float* localangle, float* R, float* slopeangle,
+	float nearRange, float Fs, float pt, float lamda, long FreqIDmax,
+	cuComplex* echoAmp, long* FreqID,
+	long len);
+
+
+extern "C" void CUDAInterpSigma(
+	long* demcls, float* sigmaAmp, float* localanglearr, long len,
+	CUDASigmaParam* sigma0Paramslist, long sigmaparamslistlen);
+
+#endif
+
+
+
--- a/GPUTool/GPUTBPImage.cu
+++ b/GPUTool/GPUTBPImage.cu
@ -0,0 +1,80 @@
+
+
+#include <iostream>
+#include <memory>
+#include <cmath>
+#include <complex>
+#include <device_launch_parameters.h>
+#include <cuda_runtime.h>
+#include <cublas_v2.h>
+#include <cuComplex.h>
+
+#include "BaseConstVariable.h"
+#include "GPUTool.cuh"
+#include "GPUTBPImage.cuh"
+
+#ifdef __CUDANVCC___
+
+
+
+__global__ void CUDA_TBPImage(
+	float* antPx, float* antPy, float* antPz,
+	float* imgx, float* imgy, float* imgz,
+	cuComplex* echoArr, cuComplex* imgArr,
+	float freq, float fs, float Rnear, float Rfar,
+	long rowcount, long colcount,
+	long prfid, long freqcount
+) {
+	int  idx = blockIdx.x * blockDim.x + threadIdx.x;
+	//printf("\nidx:\t %d %d %d\n", idx, linecount, plusepoint);
+	if (idx < rowcount * colcount) {
+		float R = sqrtf(powf(antPx[prfid] - imgx[idx], 2) + powf(antPy[prfid] - imgy[idx], 2) + powf(antPz[prfid] - imgz[idx], 2));
+		float Ridf = ((R - Rnear) * 2 / LIGHTSPEED) * fs;
+		long Rid = floorf(Ridf);
+		if(Rid <0|| Rid >= freqcount){}
+		else {
+			float factorj = freq * 4 * PI / LIGHTSPEED;
+			cuComplex Rphi =cuCexpf(make_cuComplex(0, factorj * R));// 校正项
+			imgArr[idx] = cuCaddf(imgArr[idx], cuCmulf(echoArr[Rid] , Rphi));// 矫正
+		}
+	}
+}
+
+
+extern "C" void CUDATBPImage(float* antPx, float* antPy, float* antPz,
+	float* imgx, float* imgy, float* imgz, 
+	cuComplex* echoArr, cuComplex* imgArr,
+	float freq, float fs, float Rnear, float Rfar,
+	long rowcount, long colcount, 
+	long prfid, long freqcount)
+{
+	int blockSize = 256; // 每个块的线程数
+	int numBlocks = (rowcount * colcount + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
+	//printf("\nCUDA_RTPC_SiglePRF blockSize:%d ,numBlock:%d\n",blockSize,numBlocks);
+	// 调用 CUDA 核函数 CUDA_RTPC_Kernel
+
+	CUDA_TBPImage << <numBlocks, blockSize >> > (
+		 antPx,   antPy,   antPz,
+		  imgx,  imgy,   imgz,
+		  echoArr,   imgArr,
+		  freq,   fs,   Rnear,   Rfar,
+		  rowcount,   colcount,
+		  prfid,   freqcount
+		);
+
+
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("CUDATBPImage CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+
+
+#endif
+
+
--- a/GPUTool/GPUTBPImage.cuh
+++ b/GPUTool/GPUTBPImage.cuh
@ -0,0 +1,37 @@
+#ifndef _GPUTBPIMAGE_H_
+#define _GPUTBPIMAGE_H_
+
+#include "BaseConstVariable.h"
+#include "GPUTool.cuh"
+#include <cuda_runtime.h>
+#include <device_launch_parameters.h>
+#include <cublas_v2.h>
+#include <cuComplex.h>
+#include "GPUTool.cuh"
+
+
+
+extern __global__ void CUDA_TBPImage(
+	float* antPx, float* antPy, float* antPz,
+	float* imgx, float* imgy, float* imgz,
+	cuComplex* echoArr, cuComplex* imgArr,
+	float freq, float fs, float Rnear, float Rfar,
+	long rowcount, long colcount,
+	long prfid, long freqcount
+);
+
+extern "C" void CUDATBPImage(
+	float* antPx,
+	float* antPy,
+	float* antPz,
+	float* imgx,
+	float* imgy,
+	float* imgz,
+	cuComplex* echoArr,
+	cuComplex* imgArr,
+	float freq, float fs, float Rnear, float Rfar,
+	long rowcount, long colcount,
+	long prfid, long freqcount
+);
+
+#endif
--- a/GPUTool/GPUTool.cu
+++ b/GPUTool/GPUTool.cu
@ -0,0 +1,274 @@
+
+
+#include <iostream>
+#include <memory>
+#include <cmath>
+#include <complex>
+#include <device_launch_parameters.h>
+#include <cuda_runtime.h>
+#include <cublas_v2.h>
+#include <cuComplex.h>
+
+#include "BaseConstVariable.h"
+#include "GPUTool.cuh"
+
+#ifdef __CUDANVCC___
+
+
+// 定义参数
+__device__  cuComplex cuCexpf(cuComplex x)
+{
+	float factor = exp(x.x);
+	return make_cuComplex(factor * cos(x.y), factor * sin(x.y));
+}
+
+__device__ CUDAVector GPU_VectorAB(CUDAVector A, CUDAVector B) {
+	CUDAVector C;
+	C.x = B.x - A.x;
+	C.y = B.y - A.y;
+	C.z = B.z - A.z;
+	return C;
+}
+
+__device__ float GPU_VectorNorm2(CUDAVector A) {
+	return sqrtf(A.x * A.x + A.y * A.y + A.z * A.z);
+}
+
+__device__ float GPU_dotVector(CUDAVector A, CUDAVector B) {
+	return A.x * B.x + A.y * B.y + A.z * B.z;
+}
+
+__device__ float GPU_CosAngle_VectorA_VectorB(CUDAVector A, CUDAVector B) {
+	return GPU_dotVector(A, B) / (GPU_VectorNorm2(A) * GPU_VectorNorm2(B));
+}
+
+
+__global__ void CUDA_DistanceAB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* R, long len) {
+	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
+	if (idx < len) {
+		R[idx] = sqrtf(powf(Ax[idx] - Bx[idx], 2) + powf(Ay[idx] - By[idx], 2) + powf(Az[idx] - Bz[idx], 2));
+	}
+}
+
+__global__ void CUDA_B_DistanceA(float* Ax, float* Ay, float* Az, float Bx, float By, float Bz, float* R, long len) {
+	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
+	if (idx < len) {
+		R[idx] = sqrtf(powf(Ax[idx] - Bx, 2) + powf(Ay[idx] - By, 2) + powf(Az[idx] - Bz, 2));
+	}
+}
+
+__global__ void CUDA_make_VectorA_B(float sX, float sY, float sZ, float* tX, float* tY, float* tZ, float* RstX, float* RstY, float* RstZ, long len) {
+	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
+	if (idx < len) {
+		RstX[idx] = sX - tX[idx]; // 地面->天
+		RstY[idx] = sY - tY[idx];
+		RstZ[idx] = sZ - tZ[idx];
+	}
+}
+
+__global__ void CUDA_Norm_Vector(float* Vx, float* Vy, float* Vz, float* R, long len) {
+	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
+	if (idx < len) {
+		R[idx] = sqrtf(powf(Vx[idx], 2) + powf(Vy[idx], 2) + powf(Vz[idx], 2));
+	}
+}
+
+__global__ void CUDA_cosAngle_VA_AB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* anglecos, long len) {
+	long  idx = blockIdx.x * blockDim.x + threadIdx.x;
+	if (idx < len) {
+		float tAx = Ax[idx];
+		float tAy = Ay[idx];
+		float tAz = Az[idx];
+		float tBx = Bx[idx];
+		float tBy = By[idx];
+		float tBz = Bz[idx];
+		float AR = sqrtf(powf(tAx, 2) + powf(tAy, 2) + powf(tAz, 2));
+		float BR = sqrtf(powf(tBx, 2) + powf(tBy, 2) + powf(tBz, 2));
+		float dotAB = tAx * tBx + tAy * tBy + tAz * tBz;
+		float result = acosf(dotAB / (AR * BR));
+		anglecos[idx] = result;
+	}
+}
+
+
+//错误提示
+extern "C"  void checkCudaError(cudaError_t err, const char* msg) {
+	if (err != cudaSuccess) {
+		std::cerr << "CUDA error: " << msg << " (" << cudaGetErrorString(err) << ")" << std::endl;
+		exit(EXIT_FAILURE);
+	}
+
+}
+
+// 主机参数内存声明
+extern "C"  void* mallocCUDAHost(long memsize) {
+	void* ptr;
+	cudaMallocHost(&ptr, memsize);
+
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("mallocCUDAHost CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+	return ptr;
+}
+
+// 主机参数内存释放
+extern "C"  void FreeCUDAHost(void* ptr) {
+	cudaFreeHost(ptr);
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("FreeCUDAHost CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+// GPU参数内存声明
+extern "C" void* mallocCUDADevice(long memsize) {
+	void* ptr;
+	cudaMalloc(&ptr, memsize);
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("mallocCUDADevice CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+	return ptr;
+}
+
+// GPU参数内存释放
+extern "C" void FreeCUDADevice(void* ptr) {
+	cudaFree(ptr);
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("FreeCUDADevice CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+// GPU 内存数据转移
+extern "C" void HostToDevice(void* hostptr, void* deviceptr, long memsize) {
+	cudaMemcpy(deviceptr, hostptr, memsize, cudaMemcpyHostToDevice);
+ 
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("HostToDevice CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+
+	cudaDeviceSynchronize();
+}
+
+extern "C" void DeviceToHost(void* hostptr, void* deviceptr, long memsize) {
+	cudaMemcpy(hostptr, deviceptr, memsize, cudaMemcpyDeviceToHost);
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("DeviceToHost CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+// 基础运算函数
+extern "C" void CUDAdistanceAB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* R, long len) {
+	// 设置 CUDA 核函数的网格和块的尺寸
+	int blockSize = 256; // 每个块的线程数
+	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
+	// 调用 CUDA 核函数
+	CUDA_DistanceAB << <numBlocks, blockSize >> > (Ax, Ay, Az, Bx, By, Bz, R, len);
+
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+extern "C" void CUDABdistanceAs(float* Ax, float* Ay, float* Az, float Bx, float By, float Bz, float* R, long len) {
+	// 设置 CUDA 核函数的网格和块的尺寸
+	int blockSize = 256; // 每个块的线程数
+	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
+	// 调用 CUDA 核函数
+	CUDA_B_DistanceA << <numBlocks, blockSize >> > (Ax, Ay, Az, Bx, By, Bz, R, len);
+
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+extern "C" void CUDAmake_VectorA_B(float sX, float sY, float sZ, float* tX, float* tY, float* tZ, float* RstX, float* RstY, float* RstZ, long len) {
+	// 设置 CUDA 核函数的网格和块的尺寸
+	int blockSize = 256; // 每个块的线程数
+	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
+	// 调用 CUDA 核函数
+	CUDA_make_VectorA_B << <numBlocks, blockSize >> > (sX, sY, sZ, tX, tY, tZ, RstX, RstY, RstZ, len);
+
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+extern "C" void CUDANorm_Vector(float* Vx, float* Vy, float* Vz, float* R, long len) {
+	// 设置 CUDA 核函数的网格和块的尺寸
+	int blockSize = 256; // 每个块的线程数
+	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
+	// 调用 CUDA 核函数
+	CUDA_Norm_Vector << <numBlocks, blockSize >> > (Vx, Vy, Vz, R, len);
+
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+extern "C" void CUDAcosAngle_VA_AB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* anglecos, long len) {
+	int blockSize = 256; // 每个块的线程数
+	int numBlocks = (len + blockSize - 1) / blockSize; // 根据 pixelcount 计算网格大小
+	// 调用 CUDA 核函数
+	CUDA_cosAngle_VA_AB << <numBlocks, blockSize >> > (Ax, Ay, Az, Bx, By, Bz, anglecos, len);
+
+#ifdef __CUDADEBUG__
+	cudaError_t err = cudaGetLastError();
+	if (err != cudaSuccess) {
+		printf("CUDA_RTPC_SiglePRF CUDA Error: %s\n", cudaGetErrorString(err));
+		// Possibly: exit(-1) if program cannot continue....
+	}
+#endif // __CUDADEBUG__
+	cudaDeviceSynchronize();
+}
+
+#endif
+
+
--- a/GPUTool/GPUTool.cuh
+++ b/GPUTool/GPUTool.cuh
@ -0,0 +1,74 @@
+#ifndef _GPUTOOL_H_
+#define _GPUTOOL_H_
+#ifdef __CUDANVCC___
+#include "BaseConstVariable.h"
+#include <cuda_runtime.h>
+#include <device_launch_parameters.h>
+#include <cublas_v2.h>
+#include <cuComplex.h>
+
+#define __CUDADEBUG__
+
+#define CUDAMEMORY Memory1MB*100
+
+#define LAMP_CUDA_PI 3.141592653589793238462643383279
+
+
+// 默认显存分布
+
+
+enum LAMPGPUDATETYPE {
+	LAMP_LONG,
+	LAMP_FLOAT,
+	LAMP_COMPLEXFLOAT
+};
+
+extern "C" struct CUDAVector {
+	float x;
+	float y;
+	float z;
+};
+
+extern "C" struct CUDAVectorEllipsoidal {
+	float theta;
+	float phi;
+	float pho;
+};
+
+// 定义设备函数
+extern __device__  cuComplex cuCexpf(cuComplex x);
+extern __device__ CUDAVector GPU_VectorAB(CUDAVector A, CUDAVector B);
+extern __device__ float GPU_VectorNorm2(CUDAVector A);
+extern __device__ float GPU_dotVector(CUDAVector A, CUDAVector B);
+extern __device__ float GPU_CosAngle_VectorA_VectorB(CUDAVector A, CUDAVector B);
+
+
+// 定义全局函数
+extern __global__ void CUDA_DistanceAB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* R, long len);
+extern __global__ void CUDA_B_DistanceA(float* Ax, float* Ay, float* Az, float Bx, float By, float Bz, float* R, long len);
+extern __global__ void CUDA_make_VectorA_B(float sX, float sY, float sZ, float* tX, float* tY, float* tZ, float* RstX, float* RstY, float* RstZ, long len);
+extern __global__ void CUDA_Norm_Vector(float* Vx, float* Vy, float* Vz, float* R, long len);
+extern __global__ void CUDA_cosAngle_VA_AB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* anglecos, long len);
+
+
+// 误差处理函数
+extern "C"  void checkCudaError(cudaError_t err, const char* msg);
+
+// GPU 内存函数
+extern "C" void* mallocCUDAHost(  long memsize); // 主机内存声明
+extern "C" void FreeCUDAHost(void* ptr);
+extern "C" void* mallocCUDADevice(  long memsize); // GPU内存声明
+extern "C" void FreeCUDADevice(void* ptr);
+extern "C" void HostToDevice(void* hostptr, void* deviceptr, long memsize);//GPU 内存数据转移  设备 -> GPU
+extern "C" void DeviceToHost(void* hostptr, void* deviceptr, long memsize);//GPU 内存数据转移  GPU -> 设备
+
+
+// 基础运算函数
+extern "C" void CUDAdistanceAB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* R, long member);
+extern "C" void CUDABdistanceAs(float* Ax, float* Ay, float* Az, float Bx, float By, float Bz, float* R, long member);
+extern "C" void CUDAmake_VectorA_B(float sX, float sY, float sZ, float* tX, float* tY, float* tZ, float* RstX, float* RstY, float* RstZ, long member);
+extern "C" void CUDANorm_Vector(float* Vx, float* Vy, float* Vz, float* R, long member);
+extern "C" void CUDAcosAngle_VA_AB(float* Ax, float* Ay, float* Az, float* Bx, float* By, float* Bz, float* anglecos, long len);
+
+#endif
+#endif
--- a/RasterProcessTool.vcxproj
+++ b/RasterProcessTool.vcxproj
@ -68,7 +68,7 @@
    <IncludePath>.\SimulationSAR;.\GF3ProcessToolbox;.\BaseTool;$(IncludePath)</IncludePath>
  </PropertyGroup>
  <PropertyGroup Condition="'$(Configuration)|$(Platform)' == 'Release|x64'">
-    <IncludePath>.\SimulationSAR;.\GF3ProcessToolbox;.\BaseTool;$(oneMKLIncludeDir);$(IncludePath)</IncludePath>
+    <IncludePath>.\GPUTool;.\SimulationSAR;.\GF3ProcessToolbox;.\BaseTool;$(oneMKLIncludeDir);$(IncludePath)</IncludePath>
  </PropertyGroup>
  <ItemDefinitionGroup Condition="'$(Configuration)|$(Platform)'=='Release|x64'">
    <ClCompile>
@ -184,13 +184,15 @@
    <ClInclude Include="BaseTool\EchoDataFormat.h" />
    <ClInclude Include="BaseTool\FileOperator.h" />
    <ClInclude Include="BaseTool\GeoOperator.h" />
-    <ClInclude Include="BaseTool\GPUTool.cuh" />
    <ClInclude Include="BaseTool\ImageOperatorBase.h" />
    <ClInclude Include="BaseTool\LogInfoCls.h" />
    <QtMoc Include="BaseTool\QToolProcessBarDialog.h" />
    <ClInclude Include="BaseTool\RasterToolBase.h" />
    <ClInclude Include="BaseTool\SARSimulationImageL1.h" />
    <ClInclude Include="BaseTool\stdafx.h" />
+    <ClInclude Include="GPUTool\GPURTPC.cuh" />
+    <ClInclude Include="GPUTool\GPUTBPImage.cuh" />
+    <ClInclude Include="GPUTool\GPUTool.cuh" />
    <ClInclude Include="SimulationSAR\TBPImageAlgCls.h" />
    <QtMoc Include="QSimulationRTPCGUI.h" />
    <QtMoc Include="GF3ProcessToolbox\QOrthSlrRaster.h" />
@ -213,10 +215,18 @@
    <QtMoc Include="QMergeRasterProcessDialog.h" />
  </ItemGroup>
  <ItemGroup>
-    <CudaCompile Include="BaseTool\GPUTool.cu" />
+    <None Include="cpp.hint" />
  </ItemGroup>
  <ItemGroup>
-    <None Include="cpp.hint" />
+    <CudaCompile Include="GPUTool\GPURTPC.cu">
+      <GenerateRelocatableDeviceCode Condition="'$(Configuration)|$(Platform)'=='Release|x64'">true</GenerateRelocatableDeviceCode>
+    </CudaCompile>
+    <CudaCompile Include="GPUTool\GPUTBPImage.cu">
+      <GenerateRelocatableDeviceCode Condition="'$(Configuration)|$(Platform)'=='Release|x64'">true</GenerateRelocatableDeviceCode>
+    </CudaCompile>
+    <CudaCompile Include="GPUTool\GPUTool.cu">
+      <GenerateRelocatableDeviceCode Condition="'$(Configuration)|$(Platform)'=='Release|x64'">true</GenerateRelocatableDeviceCode>
+    </CudaCompile>
  </ItemGroup>
  <Import Project="$(VCTargetsPath)\Microsoft.Cpp.targets" />
  <ImportGroup Condition="Exists('$(QtMsBuild)\qt.targets')">
--- a/SimulationSAR/RTPCProcessCls.cpp
+++ b/SimulationSAR/RTPCProcessCls.cpp
@ -21,6 +21,7 @@

 #ifdef __CUDANVCC___
 #include "GPUTool.cuh"
+#include "GPURTPC.cuh"
 #endif // __CUDANVCC___
 #include <Imageshow/ImageShowDialogClass.h>

@ -827,9 +828,9 @@ ErrorCode RTPCProcessCls::RTPCMainProcess_GPU( )
 					std::cout << "ant Position=[" << antpx << "," << antpy << "," << antpz << "]" << std::endl;
 #endif // __PRFDEBUG__

-					make_VectorA_B(antpx, antpy, antpz, d_dem_x, d_dem_y, d_dem_z, d_RstX, d_RstY, d_RstZ, pixelcount);  //  Rst = Rs - Rt; 華醱-> 硌砃 
-					Norm_Vector(d_RstX, d_RstY, d_RstZ, d_R, pixelcount); // R
-					cosAngle_VA_AB(d_RstX, d_RstY, d_RstZ, d_demsloper_x, d_demsloper_y, d_demsloper_z, d_localangle, pixelcount); // 擁窒⻌扞褒
+					CUDAmake_VectorA_B(antpx, antpy, antpz, d_dem_x, d_dem_y, d_dem_z, d_RstX, d_RstY, d_RstZ, pixelcount);  //  Rst = Rs - Rt; 華醱-> 硌砃 
+					CUDANorm_Vector(d_RstX, d_RstY, d_RstZ, d_R, pixelcount); // R
+					CUDAcosAngle_VA_AB(d_RstX, d_RstY, d_RstZ, d_demsloper_x, d_demsloper_y, d_demsloper_z, d_localangle, pixelcount); // 擁窒⻌扞褒
 					SatelliteAntDirectNormal(d_RstX, d_RstY, d_RstZ, 
 						antXaxisX, antXaxisY, antXaxisZ,
 						antYaxisX, antYaxisY, antYaxisZ,
--- a/SimulationSAR/TBPImageAlgCls.cpp
+++ b/SimulationSAR/TBPImageAlgCls.cpp
@ -7,6 +7,7 @@
 #include <QProgressDialog>
 #include <QMessageBox>
 #include "GPUTool.cuh"
+#include "GPUTBPImage.cuh"

 void CreatePixelXYZ(std::shared_ptr<EchoL0Dataset> echoL0ds, QString outPixelXYZPath)
 {
@ -400,9 +401,6 @@ void TBPImageGPUAlg(std::shared_ptr<float> antPx, std::shared_ptr<float> antPy,
 	FreeCUDADevice(d_echoArr);
 	FreeCUDADevice(d_imgArr);

-
-	// ΚΝ·ΕGPU±δΑΏ
-
 }


@ -464,8 +462,6 @@ void TBPImageGPUAlg(std::shared_ptr<float> antPx, std::shared_ptr<float> antPy,


 /**
-
-
 ErrorCode TBPImageAlgCls::ProcessCPU(long num_thread)
 {
 	omp_set_num_threads(num_thread);