A = (M, K1)
B = (K2, N)
Given a util function matmul(X1, X2), where X1 and X2 can only be tensors of shape (tile_size, tile_size). Implement tiled_matmul(A, B).
这道题要求你在只能调用固定大小 <code>tile_size × tile_size</code> 矩阵乘法工具函数的前提下,实现大矩阵的分块乘法。核心思路是把输入矩阵按 tile 切分,逐块计算并把每个输出块累加起来,避免直接对不符合尺寸要求的整矩阵调用 <code>matmul</code>。解题时需要重点处理矩阵维度对齐、边界块以及累加结果的组织方式,整体属于矩阵分块、实现题和工程化模拟题。
正文完