2024-04-13-CSAPP2_信息表示与处理

2024-04-13

计算机网络

计算机某些不可忽略的事实

int不是整数，float不是实数

$x^2$总是大于0吗？

#include<bits/stdc++.h>  
  
int main(void){  
    float x1 = 1e19;  // 1e38  
    std::cout << x1 * x1 << '\n';  
    float y1 = 50000;  // 2.5e+9  
    std::cout << y1 * y1 << '\n';  
	float x3 = 1e20;  // inf 
    std::cout << x3 * x3 << '\n';  

    int x2 = 50000;  // -1794967296  
    std::cout << x2 * x2 << '\n';  
    int y2 = 40000;  // 1600000000  
    std::cout << y2 * y2 << '\n';  
    return 0;  
}

发现对于float类型来说，确实结果总是大于0(对于超过表示范围直接输出inf) 但是对于int类型，如果结果超过了其能表示的最大值，那么会出现溢出，结果变成负数

加法结合律总是成立吗？

对无符号和有符号整数正确
浮点数：

#include<bits/stdc++.h>  
  
int main(void){  
    float x1 = 1e19;  // 1e38，double也如此
    std::cout << (x1 - x1) + 3.14 << '\n';  // 3.14  
    std::cout << x1 - (x1 + 3.14) << '\n';  // 0  
    return 0;  
}

对于浮点数，由于其表示方式是“符号位+阶码+尾码”形式，因此对于位数相差过多的数会因为舍入产生误差(对阶过程中因为需要小阶对大阶，所以阶码需要一直加，然后尾码在不断右移时丢失了，计组的知识了)

计算机算数性质

不会产生随机值(这里说的不是random的伪随机问题，而是计算机的算数运算一般情况下符合正常规则，不会有异常) - 算术运算有重要的数学性质
不能假设所有“通常”的数学性质成立 - 整数运算满足“环”性质(交换率、结合率和分配律成立)
- 浮点运算满足“按序”性质(满足单调性)
需要理解哪些抽象适用于哪些上下文

你必须懂汇编语言

存储器很重要

随机访问存储器是一种非物质抽象

内存不是无限界的
- 它必须进行分配和管理
- 很多应用都受内存空间的限制
存储器性能并不一致
- 高速缓冲和虚拟存储器可以显著影响程序性能
- 根据存储系统特点调整程序可以导致很大速度改进
内存引用错误特别有害
- 在时间和空间上都是影响滞后的

#include<iostream>  
  
using namespace std;  
  
typedef struct{  
    int a[2];  
    double d;  
}struct_t;  
  
double fun(int i){  
    volatile struct_t s;  
    s.d = 3.14;  
    s.a[i] = 1073741824;   
    return s.d;  
}  
  
int main(void){  
    for(int i = 0; i <= 6; i++){  
        cout << "fun(" << i << ") = " << fun(i) << endl;  
    }  
    return 0;  
}
/* linux 运行结果
fun(0)= 3.140000000000
fun(1)= 3.140000000000
fun(2)= 3.139999866486
fun(3)= 2.000000610352
fun(4)= 3.140000000000
fun(5)= 3.140000000000
*** stack smashing detected ***: terminated
Aborted
*/

如图所示，因为a数组只分配了两个地址，一个地址4个字节，而double分配了8个字节，所以当i=2的时候，a[i]会修改double的前4个字节，而i=3同理。对于十进制的1073741824转换为2进制为0100 0000 0000 0000 0000 0000 0000 0000 对于十进制的3.14，转换为2进制为0100 0000 0100 1000 1111 0101 1100 0010

这里涉及到的是double的IEEE标准：1位符号位 + 11位阶码位 + 52位尾码位，以及大端表示

当覆盖了d0-d3实际上是将值覆盖了部分尾码，因为0100影响的很小，结果没有太大的改变
当覆盖了d4-d7实际上覆盖的是符号位+所有阶码位+一部分尾码位，使得前面的值只有0100...0000，然后因为阶码是移码表示的，所以变成了$2^{2^11 - (2^11 - 1)}=2$，尾数留下了一小部分，使得结果含有无规律的小数

内存引用错误 Memory Referencing Errors

C语言和C++不提供任何内存保护
- 数组引用超界
- 不合法的指针值
- 分配和释放内存滥用
可能导致严重的错误
- 是否错误有任何影响取决于系统和编译器
- 在远处产生影响
  - 破坏的对象逻辑上和访问的对象毫不相关
  - 错误的效果第一次观察到可能距离产生的时间很长
这种情况应该如何处理？
- 采用Java、Ruby、Python、ML等编程
- 理解可能会发生什么相互影响
- 使用或开发工具来检测引用错误（例如Valgrind）