准备工作
下载
首先选择ubuntu版本并下载.iso镜像文件,这里选择的事ubuntu20.04-live-server版本(非桌面版),也可以下载desktop桌面版。使用将.iso文件烧录到U盘里
信息记录
记录一些重装前系统的配置,在之后安装的时候好按照之前的配置方式进行重配置
# 看一下/home、/boot等分区的大小
df -h
# 看一下swap分区的大小
free -g
# 记录下网络信息
ifconfig
开始重装
将U盘插入服务器上,服务器开机并进入bios(按F11,不同电脑不通用)选择引导项为U盘,即开始进入安装程序。具体的安装步骤如此博客言Ubuntu Server 20.04.1 LTS安装配置图解教程 | 系统运维 (osyunwei)
但有几点需要注意
网络配置
如果默认情况下,下一步的选项是“Continue without network”和“Back”,意味着目前的配置是连不上网络的,需要手动配置。
具体需要配置的几个项是subnet, address, gateway。在机房的服务器的address一般是固定的,gateway和subnet需要实际分析,我的实际情况是subnet是address的最后一位改成0,再加/24,gateway是将address的最后一位改成1(也就是比subnet多1)。Ubuntu 20.04.4 Server 图文安装[含磁盘分区]_ubuntu2004server安装教程-CSDN博客
原有数据
重装时可以保留一些盘的数据不被格式化。在安装到分区步骤时,尽可能区分一下哪一些物理盘是数据盘,哪一些是系统盘。根据经验,一般分区数较多的是之前的系统盘,而存储空间比较大的是之前的数据盘。
被分区较多的系统盘需要重新格式化(reformat)之后重新分区,用户数据无法保留,因此在/home文件夹下的数据会被清除,具体的分区大小可参考(swap、/boot、根目录/、/home)详解安装Ubuntu Linux系统时硬盘分区最合理的方法-腾讯云开发者社区-腾讯云 (tencent)
数据盘的数据可以被保留,只需重新挂载即可(别对其进行format或者是reformat就行)。有些数据盘有分区可以直接在安装时进行重新挂载的操作(未挂载会显示unmounted,选择edit->mount->other->/data1),有些未分区的完整disk在安装界面没有mount的选项,可以在系统安装完毕后再进行挂载。
(这个图不完全符合,大概是这里的mount选项)
# 查看磁盘状态
fdisk -l
# 创建挂载位置文件夹
mkdir /ssd_data1
# 开始挂载分区
mount /dev/sdb /ssd_data1
# 因为mount挂载在重启服务器后会失效,所以需要将分区信息写到/etc/fstab文件中让它永久挂载
vim /etc/fstab
# 加入:
/dev/sdb1(磁盘分区) /data1(挂载目录) ext4(文件格式)defaults 0 0
重装完毕后
系统安装完毕后有一些工作需要做
root账户密码设置
su和sudo不一样,使用su需要root的密码
# 设置密码,根据提示输入两次密码
sudo passwd root
# 测试进入root
su - root
网络设置
在机房的服务器安装后可能会出现执行一些命令报如下错,在执行apt-get和ping等需要网络的操作的时候出现
Temporary failure resolving 'mirrors.163'
我是通过如下方式解决的
sudo apt date 的时候换源阿里云镜像问题 - 简书 (jianshu)
sudo vi /etc/resolv.conf
加上(一定是加上哈)
nameserver 8.8.8.8
nameserver 114.114.114.114
新建用户并赋予权限
参考链接:Ubuntu添加用户并赋sudo权限_addsudouser-CSDN博客
用户免密登录
在自己电脑上首先生成密钥,然后将公钥上传到服务器上即可实现免密登录
# 生成公私钥对
ssh-keygen -t rsa
# 如果是windows的公钥上传到linux服务器
ssh username@host “cat >> ~/.ssh/authorized_keys” < C:\User\name\.ssh\id_rsa.pub
# 如果是linux的公钥上传到linux服务器
ssh-copy-id -i ~/.ssh/id_rsa.pub username@host
老电脑登录问题
如果一台电脑之前连接过重装前的服务器(使用私钥),那么重装后需要清楚之前连接的缓存才能成功连接
windows:删除本地.ssh/known_hosts里面的缓存信息即可
ssh登录错误ECDSA host key for ip has changed解决方案-CSDN博客
数据盘权限问题
重装后挂载的数据盘的权限是不对的,访问文件会显示permission denied,需要将权限改为普通用户
sudo chmod -R 777 /data1
配置深度学习环境(可选)
首先安装一些必要的库
su - root
apt install gcc
apt install make
在英伟达官网下载显卡驱动并安装官方驱动 | NVIDIA
使用nvidia-smi测试是否安装成功,若nvidia-smi响应太慢,可更改为节能模式为持久模式
nvidia-smi
# 更改为持久模式
sudo nvidia-persistenced
在官网下载并安装cudaCUDA Toolkit 12.4 Update 1 Downloads | NVIDIA Developer
因为事先已经安装了nvidia driver,所以在cuda安装时可以将默认重新安装的nvidia driver取消(按空格)
下载并安装AnacondaUnleash AI Innovation and Value | Anaconda
新建环境并安装torch测试
# 新建环境
conda create -n default python=3.8
# 激活环境
conda activate default
# 安装torch 官网:https://pytorch/
pip3 install torch torchvision torchaudio
# 测试
python
>>> import torch
>>> torch.cuda.is_available()
>>> torch.cuda.device_count()
准备工作
下载
首先选择ubuntu版本并下载.iso镜像文件,这里选择的事ubuntu20.04-live-server版本(非桌面版),也可以下载desktop桌面版。使用将.iso文件烧录到U盘里
信息记录
记录一些重装前系统的配置,在之后安装的时候好按照之前的配置方式进行重配置
# 看一下/home、/boot等分区的大小
df -h
# 看一下swap分区的大小
free -g
# 记录下网络信息
ifconfig
开始重装
将U盘插入服务器上,服务器开机并进入bios(按F11,不同电脑不通用)选择引导项为U盘,即开始进入安装程序。具体的安装步骤如此博客言Ubuntu Server 20.04.1 LTS安装配置图解教程 | 系统运维 (osyunwei)
但有几点需要注意
网络配置
如果默认情况下,下一步的选项是“Continue without network”和“Back”,意味着目前的配置是连不上网络的,需要手动配置。
具体需要配置的几个项是subnet, address, gateway。在机房的服务器的address一般是固定的,gateway和subnet需要实际分析,我的实际情况是subnet是address的最后一位改成0,再加/24,gateway是将address的最后一位改成1(也就是比subnet多1)。Ubuntu 20.04.4 Server 图文安装[含磁盘分区]_ubuntu2004server安装教程-CSDN博客
原有数据
重装时可以保留一些盘的数据不被格式化。在安装到分区步骤时,尽可能区分一下哪一些物理盘是数据盘,哪一些是系统盘。根据经验,一般分区数较多的是之前的系统盘,而存储空间比较大的是之前的数据盘。
被分区较多的系统盘需要重新格式化(reformat)之后重新分区,用户数据无法保留,因此在/home文件夹下的数据会被清除,具体的分区大小可参考(swap、/boot、根目录/、/home)详解安装Ubuntu Linux系统时硬盘分区最合理的方法-腾讯云开发者社区-腾讯云 (tencent)
数据盘的数据可以被保留,只需重新挂载即可(别对其进行format或者是reformat就行)。有些数据盘有分区可以直接在安装时进行重新挂载的操作(未挂载会显示unmounted,选择edit->mount->other->/data1),有些未分区的完整disk在安装界面没有mount的选项,可以在系统安装完毕后再进行挂载。
(这个图不完全符合,大概是这里的mount选项)
# 查看磁盘状态
fdisk -l
# 创建挂载位置文件夹
mkdir /ssd_data1
# 开始挂载分区
mount /dev/sdb /ssd_data1
# 因为mount挂载在重启服务器后会失效,所以需要将分区信息写到/etc/fstab文件中让它永久挂载
vim /etc/fstab
# 加入:
/dev/sdb1(磁盘分区) /data1(挂载目录) ext4(文件格式)defaults 0 0
重装完毕后
系统安装完毕后有一些工作需要做
root账户密码设置
su和sudo不一样,使用su需要root的密码
# 设置密码,根据提示输入两次密码
sudo passwd root
# 测试进入root
su - root
网络设置
在机房的服务器安装后可能会出现执行一些命令报如下错,在执行apt-get和ping等需要网络的操作的时候出现
Temporary failure resolving 'mirrors.163'
我是通过如下方式解决的
sudo apt date 的时候换源阿里云镜像问题 - 简书 (jianshu)
sudo vi /etc/resolv.conf
加上(一定是加上哈)
nameserver 8.8.8.8
nameserver 114.114.114.114
新建用户并赋予权限
参考链接:Ubuntu添加用户并赋sudo权限_addsudouser-CSDN博客
用户免密登录
在自己电脑上首先生成密钥,然后将公钥上传到服务器上即可实现免密登录
# 生成公私钥对
ssh-keygen -t rsa
# 如果是windows的公钥上传到linux服务器
ssh username@host “cat >> ~/.ssh/authorized_keys” < C:\User\name\.ssh\id_rsa.pub
# 如果是linux的公钥上传到linux服务器
ssh-copy-id -i ~/.ssh/id_rsa.pub username@host
老电脑登录问题
如果一台电脑之前连接过重装前的服务器(使用私钥),那么重装后需要清楚之前连接的缓存才能成功连接
windows:删除本地.ssh/known_hosts里面的缓存信息即可
ssh登录错误ECDSA host key for ip has changed解决方案-CSDN博客
数据盘权限问题
重装后挂载的数据盘的权限是不对的,访问文件会显示permission denied,需要将权限改为普通用户
sudo chmod -R 777 /data1
配置深度学习环境(可选)
首先安装一些必要的库
su - root
apt install gcc
apt install make
在英伟达官网下载显卡驱动并安装官方驱动 | NVIDIA
使用nvidia-smi测试是否安装成功,若nvidia-smi响应太慢,可更改为节能模式为持久模式
nvidia-smi
# 更改为持久模式
sudo nvidia-persistenced
在官网下载并安装cudaCUDA Toolkit 12.4 Update 1 Downloads | NVIDIA Developer
因为事先已经安装了nvidia driver,所以在cuda安装时可以将默认重新安装的nvidia driver取消(按空格)
下载并安装AnacondaUnleash AI Innovation and Value | Anaconda
新建环境并安装torch测试
# 新建环境
conda create -n default python=3.8
# 激活环境
conda activate default
# 安装torch 官网:https://pytorch/
pip3 install torch torchvision torchaudio
# 测试
python
>>> import torch
>>> torch.cuda.is_available()
>>> torch.cuda.device_count()