Страница 1 из 1
Зависание и последующая ошибка initramfs
Добавлено: 07 дек 2020, 18:30
ALISX
Не первый раз на LM 20 сталкиваюсь с такой бедой.
После обновления и нескольких перезагрузок(!!!) во время работы ноут зависает намертво.
Обычно лечиться перезагрузкой. Все оборудование проверено утилиами биоса и проблем нет.
В этот же раз после перезагрузки сваливался в рекавери с ошибками типа initramfs unpaking failed. Похоже, что во время зависания повредилось что-то загрузочное.
Починилось же довольно просто.
На флешку загрузил live образ с LM.
Загрузился с него и стандартной утилитой Disks проверил диски и исправил файловые системы.
Далее опять же стандартной утилитой Boot Repair с дефолтными настройками восстановил Grub.
И все заработало.
Надеюсь, кому-то пригодится.
Зависание и последующая ошибка initramfs
Добавлено: 07 дек 2020, 22:02
slant
Возможно у вас перепутана причина со следствием - не повреждения при зависании.
Зависания потому, что диску плохо, и он отваливается да портит содержимое...
Зависание и последующая ошибка initramfs
Добавлено: 07 дек 2020, 22:04
ALISX
slant писал(а): ↑07 дек 2020, 22:02
Возможно у вас перепутана причина со следствием - не повреждения при зависании.
Зависания потому, что диску плохо, и он отваливается да портит содержимое...
Не исключаю. Но по smart с диском все в порядке. Куда еще копать - хз.
Зависание и последующая ошибка initramfs
Добавлено: 07 дек 2020, 22:22
slant
ALISX писал(а): ↑07 дек 2020, 22:04
Не исключаю. Но по smart с диском все в порядке. Куда еще копать - хз.
В основные логи естественно.
journalctl -b
для последней (текущей) сессии,
journalctl -b -1
- для предыдущей и т.д.
Зависание и последующая ошибка initramfs
Добавлено: 08 дек 2020, 07:07
rogoznik
ALISX писал(а): ↑07 дек 2020, 22:04
Но по smart с диском все в порядке.
Вот прям 100% - чет сомневаюсь. Покажи вывод
sudo smartctl -a <твой диск>
Зависание и последующая ошибка initramfs
Добавлено: 08 дек 2020, 16:12
ALISX
rogoznik писал(а): ↑08 дек 2020, 07:07
ALISX писал(а): ↑07 дек 2020, 22:04
Но по smart с диском все в порядке.
Вот прям 100% - чет сомневаюсь. Покажи вывод
sudo smartctl -a <твой диск>
NVME диск для рута и home:
smartctl -a /dev/nvme0
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-56-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Number: SAMSUNG MZVLQ256HAJD-000H1
Serial Number: S4UJNF0N278575
Firmware Version: HPS4NFXV
PCI Vendor/Subsystem ID: 0x144d
IEEE OUI Identifier: 0x002538
Total NVM Capacity: 256 060 514 304 [256 GB]
Unallocated NVM Capacity: 0
Controller ID: 5
Number of Namespaces: 1
Namespace 1 Size/Capacity: 256 060 514 304 [256 GB]
Namespace 1 Utilization: 67 681 529 856 [67,6 GB]
Namespace 1 Formatted LBA Size: 512
Namespace 1 IEEE EUI-64: 002538 a201b54e2b
Local Time is: Tue Dec 8 16:09:05 2020 MSK
Firmware Updates (0x16): 3 Slots, no Reset required
Optional Admin Commands (0x0017): Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f): Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Maximum Data Transfer Size: 512 Pages
Warning Comp. Temp. Threshold: 79 Celsius
Critical Comp. Temp. Threshold: 82 Celsius
Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 4.86W - - 0 0 0 0 0 0
1 + 4.49W - - 1 1 1 1 0 0
2 + 2.37W - - 2 2 2 2 0 500
3 - 0.0500W - - 3 3 3 3 210 1200
4 - 0.0050W - - 4 4 4 4 1000 9000
Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 0
1 - 4096 0 0
=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 20 Celsius
Available Spare: 100%
Available Spare Threshold: 5%
Percentage Used: 0%
Data Units Read: 664 496 [340 GB]
Data Units Written: 1 093 564 [559 GB]
Host Read Commands: 9 451 378
Host Write Commands: 21 937 454
Controller Busy Time: 106
Power Cycles: 565
Power On Hours: 155
Unsafe Shutdowns: 63
Media and Data Integrity Errors: 0
Error Information Log Entries: 221
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 20 Celsius
Error Information (NVMe Log 0x01, max 64 entries)
No Errors Logged
SSD диск с данными:
smartctl -a /dev/sda
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-56-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Family: Samsung based SSDs
Device Model: Samsung SSD 850 EVO 500GB
Serial Number: S3NXNF0J813561T
LU WWN Device Id: 5 002538 d422dbe24
Firmware Version: EMT03B6Q
User Capacity: 500 107 862 016 bytes [500 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Form Factor: 2.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Tue Dec 8 16:11:19 2020 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 0) seconds.
Offline data collection
capabilities: (0x53) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 265) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 4638
12 Power_Cycle_Count 0x0032 097 097 000 Old_age Always - 2865
177 Wear_Leveling_Count 0x0013 099 099 000 Pre-fail Always - 13
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0
181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 100 100 010 Pre-fail Always - 0
187 Uncorrectable_Error_Cnt 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0032 068 043 000 Old_age Always - 32
195 ECC_Error_Rate 0x001a 200 200 000 Old_age Always - 0
199 CRC_Error_Count 0x003e 100 100 000 Old_age Always - 0
235 POR_Recovery_Count 0x0012 099 099 000 Old_age Always - 94
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 7547544576
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Aborted by host 90% 4630 -
# 2 Short offline Completed without error 00% 4477 -
# 3 Short offline Completed without error 00% 1439 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
255 0 65535 Read_scanning was never started
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Зависание и последующая ошибка initramfs
Добавлено: 09 дек 2020, 22:24
Unborn
rogoznik писал(а): ↑08 дек 2020, 07:07
Вот прям 100% - чет сомневаюсь.
Да бывает, если говносборки какие-либо приляпывают, по питанию аварийное отключение во время активной работы дисков. Там ТС-у даже написано что к чему и что посмотреть, как в лог заглянуть. Но ему по ... Тему можно прикрыть.
Зависание и последующая ошибка initramfs
Добавлено: 11 дек 2020, 22:21
ALISX
Unborn писал(а): ↑09 дек 2020, 22:24
rogoznik писал(а): ↑08 дек 2020, 07:07
Вот прям 100% - чет сомневаюсь.
Да бывает, если говносборки какие-либо приляпывают, по питанию аварийное отключение во время активной работы дисков. Там ТС-у даже написано что к чему и что посмотреть, как в лог заглянуть. Но ему по ... Тему можно прикрыть.
Какие говносборки? Какое аварийное питание? Написано же, что это ноут. Вы вообще о чем?
Почему "ему по..."? Логи journalctl я б дал, если повторится. Результаты smartctl я дал.