# ASM / C
### a) ¿Qué hace el código?
Recorre el array `arrayx` (empezando por la posición 1) de tamaño `N_ITER` almacenando en la posición `i - 1` la suma del elemento `i` más el `i + 1` entre la constante `f11`.
### b) ¿Cómo se puede escribir en alto nivel?
```C
#define N_ITER 25
float arrayx[N_ITER];
const float f11 = 21.0;
for(int i = 1; i < N_ITER; i++)
{
arrayx[i - 1] = ( arrayx[i] + arrayx[i + 1] ) / f11;
}
```
### c) ¿Son paralelizables directamente?
Sí porque no hay dependencias reales.
```C
#define N_ITER 25
float arrayx[N_ITER];
const float f11 = 21.0;
for(int i = 5; i < N_ITER; i+=5)
{
arrayx[i - 1] = ( arrayx[i] + arrayx[i + 1] ) / f11;
arrayx[i - 2] = ( arrayx[i + 1] + arrayx[i + 2] ) / f11;
arrayx[i - 3] = ( arrayx[i + 2] + arrayx[i + 3] ) / f11;
arrayx[i - 4] = ( arrayx[i + 3] + arrayx[i + 4] ) / f11;
arrayx[i - 5] = ( arrayx[i + 4] + arrayx[i + 5] ) / f11;
}
```
### d) Como la BTB predice siempre tomado ¿cuándo acierta?
La BTB acertará en todas las iteraciones del bucle excepto en la última porque predice salto tomado y no debería tomarlo porque el bucle ha acabado.
![[Pasted image 20241022134454.png]]
### e) Si la BTB de un GPP es muy sofisticada ¿acertará en los saltos?
...
# Visual Studio
La función más paralelizable es **`pp4()`** ya que sólo tiene una operación de cada tipo (**`LD, SF, ADDF, SLTI, ADDI`**) y no hay saltos condicionales en el bucle.
```C
double pp4()
{
int i;
for (i = 0; iMáquina en la que se ejecuta el código real:
![[Pasted image 20241022144429.png|400]]
### Comparativa
| `pp2()` | `nuestro` |
| -------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| double pp2()
{
int i;
for (i = 0; i a[i] = 3.14 / sqrt(b[i]+c[i]);
}
return a[N_ITER - 1];
} | # define N_ITER 25
float arrayx[N_ITER];
const float f11 = 21.0;
for(int i = 1; i < N_ITER; i++)
{
arrayx[i - 1] = ( arrayx[i] + arrayx[i + 1] ) / f11;
} |
| Este código tiene:
- 2x LDF
- 1x STF
- 1x ADDF
- 1x DIVF
- 1x constante | Nuestro código tiene:
- 2x LDF
- 1x STF
- 1x ADDF
- 1x DIVF
- 1x constante |
| | |
### Duración de CPI en los bucles
| Release | Debug |
| ------------------------------------ | ------------------------------------ |
| ![[Pasted image 20241022144832.png]] | ![[Pasted image 20241022150214.png]] |
(Todo para config1 y config2)
5. GFLOPS (o MIPS)
6. CPI (pp2 pp4) y Ac
7. Cronograma