A deleted cluster jackknifed sample is created by filtering out (deleting) clusters of data, where d is the percent of clusters removed at random.
这道题考察的是分组抽样中的 jackknife 思想:把数据按 cluster 分组后,随机删除其中一部分 cluster,再基于剩余数据构造样本。解题时通常先每条记录所属的组,再按比例随机选出需要删除的组,并过滤掉这些组对应的所有行。重点在于“按 cluster 而不是按单条记录”进行删除,因此要保持组内样本整体一致,适合用 pandas 分组、随机采样和布尔过滤来实现。
正文完