修改多卡无天线辐射图代码

2025-03-24 10:36:46 +08:00 · 2025-03-24 10:36:46 +08:00 · 4cf63eee36
parent 96eb60bbec
commit 4cf63eee36
3 changed files with 256 additions and 74 deletions
--- a/Toolbox/SimulationSARTool/SimulationSAR/GPURFPC.cu
+++ b/Toolbox/SimulationSARTool/SimulationSAR/GPURFPC.cu
@ -473,6 +473,150 @@ void CUDA_RFPC_MainProcess(


 /* 核函数 ****************************************************************************************************************************/
+
+__global__ void Kernel_Computer_R_amp_NoAntPattern(
+	SateState* antlist,
+	long PRFCount,
+	GoalState* goallist,
+	long demLen,
+	long startPosId, long pixelcount,
+	CUDASigmaParam sigma0Params,
+	double Pt,
+	double refPhaseRange,
+	double NearR, double FarR,
+	double* d_temp_R, double* d_temp_amps// 计算输出
+) {
+	long idx = blockIdx.x * blockDim.x + threadIdx.x; // 获取当前的线程编码
+	long prfId = idx / SHAREMEMORY_FLOAT_HALF;
+	long posId = idx % SHAREMEMORY_FLOAT_HALF + startPosId; // 当前线程对应的影像点
+
+	if (prfId < PRFCount && posId < pixelcount) {
+		double RstX = antlist[prfId].Px - goallist[posId].Tx; // 计算坐标矢量
+		double RstY = antlist[prfId].Py - goallist[posId].Ty;
+		double RstZ = antlist[prfId].Pz - goallist[posId].Tz;
+
+		double RstR = sqrt(RstX * RstX + RstY * RstY + RstZ * RstZ); // 矢量距离
+		if (RstR<NearR || RstR>FarR) {
+			d_temp_R[idx] = 0;
+			d_temp_amps[idx] = 0;
+			return;
+		}
+		else {
+			double slopeX = goallist[posId].TsX;
+			double slopeY = goallist[posId].TsY;
+			double slopeZ = goallist[posId].TsZ;
+
+			double slopR = sqrtf(slopeX * slopeX + slopeY * slopeY + slopeZ * slopeZ); //  
+			if (abs(slopR - 0) > 1e-3) {
+				double dotAB = RstX * slopeX + RstY * slopeY + RstZ * slopeZ;
+				double localangle = acos(dotAB / (RstR * slopR));
+
+				if (localangle < 0 || localangle >= LAMP_CUDA_PI / 2 || isnan(localangle)) {
+					d_temp_R[idx] = 0;
+					d_temp_amps[idx] = 0;
+					return;
+				}
+				else {}
+
+				double	ampGain = 1;
+				ampGain = ampGain / (powf(4 * LAMP_CUDA_PI, 2) * powf(RstR, 4)); // 反射强度
+				double sigma = GPU_getSigma0dB(sigma0Params, localangle);
+				sigma = powf(10.0, sigma / 10.0);
+
+				double temp_amp = double(ampGain * Pt * sigma);
+				double temp_R = double(RstR - refPhaseRange);
+
+				bool isNan = !(isnan(temp_amp) || isnan(temp_R) || isinf(temp_amp) || isinf(temp_R));
+
+
+				d_temp_amps[idx] = temp_amp * isNan;
+				d_temp_R[idx] = temp_R * isNan;
+				return;
+			}
+		}
+	}
+}
+
+
+
+
+__global__ void CUDA_Kernel_Computer_echo_NoAntPattern(
+	double* d_temp_R, double* d_temp_amps, long posNum,
+	double f0, double dfreq,
+	long FreqPoints, // 当前频率的分块
+	long maxfreqnum, // 最大脉冲值
+	cuComplex* echodata,
+	long temp_PRF_Count
+) {
+	__shared__ float s_R[SHAREMEMORY_FLOAT_HALF];  // 注意一个完整的block_size 共享相同内存
+	__shared__ float s_amp[SHAREMEMORY_FLOAT_HALF];
+
+	long tid = threadIdx.x;
+	long bid = blockIdx.x;
+	long idx = bid * blockDim.x + tid;
+	long prfId = idx / FreqPoints; // 脉冲ID
+	long fId = idx % FreqPoints;//频率ID
+
+	long psid = 0;
+	long pixelId = 0;
+	for (long ii = 0; ii < SHAREMEMORY_FLOAT_HALF_STEP; ii++) { // SHAREMEMORY_FLOAT_HALF_STEP * BLOCK_SIZE=SHAREMEMORY_FLOAT_HALF
+		psid = tid * SHAREMEMORY_FLOAT_HALF_STEP + ii;
+		pixelId = prfId * posNum + psid; // 
+		if (psid < posNum) {
+			s_R[psid] = d_temp_R[pixelId];
+			s_amp[psid] = d_temp_amps[pixelId];
+		}
+		else {
+			s_R[psid] = 0;
+			s_amp[psid] = 0;
+		}
+
+	}
+
+	__syncthreads(); // 确定所有待处理数据都已经进入程序中
+
+
+
+	if (fId < maxfreqnum && prfId < temp_PRF_Count) {
+
+		long echo_ID = prfId * maxfreqnum + fId; // 计算对应的回波位置
+		float factorjTemp = RFPCPIDIVLIGHT * (f0 + fId * dfreq);
+		cuComplex echo = make_cuComplex(0, 0);
+		float temp_phi = 0;
+		float temp_amp = 0;
+		for (long dataid = 0; dataid < SHAREMEMORY_FLOAT_HALF; dataid++) {
+
+			temp_phi = s_R[dataid] * factorjTemp;
+			temp_amp = s_amp[dataid];
+			echo.x += (temp_amp * cosf(temp_phi));
+			echo.y += (temp_amp * sinf(temp_phi));
+			//if (dataid > 5000) {
+			//	printf("echo_ID=%d; dataid=%d;ehodata=(%f,%f);R=%f;amp=%f;\n", echo_ID, dataid, temp_real, temp_imag, s_R[0], s_amp[0]);
+			//}
+			if (isnan(temp_phi) || isnan(temp_amp) || isnan(echo.x) || isnan(echo.y)
+				|| isinf(temp_phi) || isinf(temp_amp) || isinf(echo.x) || isinf(echo.y)
+				) {
+				printf("[amp,phi,real,imag]=[%f,%f,%f,%f];\n", temp_amp, temp_phi, echo.x, echo.y);
+			}
+
+		}
+ 
+		echodata[echo_ID] = cuCaddf(echodata[echo_ID], echo);
+ 
+	}
+}
+
+
+
+
+
+
+
+
+
+
+
+
 __global__ void CUDA_Kernel_RFPC(
 	SateState* antlist,
 	long PRFCount, long Freqcount, // 整体的脉冲数，
@ -552,24 +696,62 @@ __global__ void CUDA_Kernel_RFPC(

 /**  分块处理 ****************************************************************************************************************/

-extern "C" void ProcessRFPCTask(RFPCTask& task)
+extern "C" void ProcessRFPCTask(RFPCTask& task, long devid)
 {
 	size_t pixelcount = task.prfNum * task.freqNum;
 	size_t grid_size = (pixelcount + BLOCK_SIZE - 1) / BLOCK_SIZE;
 	printf("start %d,%d ,%d,%d\n", pixelcount, task.targetnum, grid_size, BLOCK_SIZE);
-	CUDA_Kernel_RFPC << <grid_size, BLOCK_SIZE >> >  (
+
+	double* d_R = (double*)mallocCUDADevice(task.prfNum * SHAREMEMORY_FLOAT_HALF * sizeof(double), devid);
+	double* d_amps = (double*)mallocCUDADevice(task.prfNum * SHAREMEMORY_FLOAT_HALF * sizeof(double), devid);
+
+
+	long BLOCK_FREQNUM = NextBlockPad(task.freqNum, BLOCK_SIZE); // 256*freqBlockID
+	long cudaBlocknum = 0;
+	long freqpoints = BLOCK_FREQNUM;
+	printf("freqpoints:%d\n", freqpoints);
+	long process = 0;
+	for (long sTi = 0; sTi < task.targetnum; sTi = sTi + SHAREMEMORY_FLOAT_HALF) {
+		cudaBlocknum = (task.prfNum * SHAREMEMORY_FLOAT_HALF + BLOCK_SIZE - 1) / BLOCK_SIZE;
+		Kernel_Computer_R_amp_NoAntPattern << <cudaBlocknum, BLOCK_SIZE >> >(
 			task.antlist,
-		task.prfNum,task.freqNum,
+			task.prfNum,
 			task.goallist,
 			task.targetnum,
-		task.startFreq,task.stepFreq,
-		task.Rref,task.Rnear,task.Rfar,
+			sTi, task.targetnum,
 			task.sigma0_cls,
-		task.d_echoData
+			1,
+			task.Rref,
+			task.Rnear, task.Rfar,
+			d_R, d_amps// 计算输出
 		);
-	PrintLasterError("ProcessRFPCTask");
+		PrintLasterError("CUDA_Kernel_Computer_R_amp");
+
+
+		cudaBlocknum = (task.prfNum * BLOCK_FREQNUM + BLOCK_SIZE - 1) / BLOCK_SIZE;
+		CUDA_Kernel_Computer_echo_NoAntPattern << <cudaBlocknum, BLOCK_SIZE >> > (
+			d_R, d_amps, SHAREMEMORY_FLOAT_HALF,
+			task.startFreq, task.stepFreq,
+			freqpoints, task.freqNum,
+			task.d_echoData,
+			task.prfNum
+			);
+		PrintLasterError("CUDA_Kernel_Computer_echo");
+
+		if ((sTi * 100.0 / task.targetnum) - process >= 1) {
+			process = sTi * 100.0 / task.targetnum;
+			PRINT("TargetID [%f]: %d / %d finished\n", sTi * 100.0 / task.targetnum, sTi, task.targetnum);
+		}
+
+
+
+	}
+
+
 	cudaDeviceSynchronize();
-	printf("start %d \n", task.targetnum);
+
+	FreeCUDADevice(d_R);
+	FreeCUDADevice(d_amps);
 }


--- a/Toolbox/SimulationSARTool/SimulationSAR/GPURFPC.cuh
+++ b/Toolbox/SimulationSARTool/SimulationSAR/GPURFPC.cuh
@ -144,7 +144,7 @@ extern "C" void CUDA_RFPC_MainProcess(


 extern "C" double* hostSigmaData_toDevice(int devid);
-extern "C" void ProcessRFPCTask(RFPCTask& task);
+extern "C" void ProcessRFPCTask(RFPCTask& task,long devid);



--- a/Toolbox/SimulationSARTool/SimulationSAR/RFPCProcessCls.cpp
+++ b/Toolbox/SimulationSARTool/SimulationSAR/RFPCProcessCls.cpp
@ -1103,7 +1103,7 @@ ErrorCode RFPCProcessCls::RFPCMainProcess_GPU_NoAntPattern(size_t startprfid, si
 		task.goallist = (GoalState*)mallocCUDADevice(clscount * sizeof(GoalState), devId);
 		HostToDevice(clsGoalStateDict[clsid].get(), task.goallist, sizeof(GoalState) * clscount);
 		task.sigma0_cls = clsCUDASigmaParamsDict[clsid];
-		ProcessRFPCTask(task);
+		ProcessRFPCTask(task,devId);
 		FreeCUDADevice(task.goallist);
 	}