Clear Linux와 Chelsio 둘

1.
Clear Linux와 Chelsio 하나에 이어지는 글입니다.
지난 글에서 빌드까지 확인하였습니다. 빌드가 되었다고 모든 것이 끝난 것은 아닙니다. Chelsio는 TOE와 관련한 기능을 커널모듈로 지원하기 때문에 해당 모듈이 커널에서 동작하도록 하여야 합니다.

시스템을 부탕한 후 다음과 같은 명령어를 실행하였습니다.

oot@Clearlinux/home/smallake # modprobe t4_tom

그리고 커널모듈이 정상적으로 올라왔는지를 확인하였습니다.

​root@Clearlinux/home/smallake # lsmod | grep t4_tom
t4_tom 188416 1
toecore 36864 1 t4_tom
cxgb4 811008 1 t4_tom

이상만 보면 정상적이라고 생각할 수 있지만 제가 일부러 하나를 빼놓았습니다. modprobe한 이후 결과값입니다. 보통 정상적으로 동작하면 아무런 반응이 없습니다. 그래서 lsmod로 확인합니다. 그런데 이번 경우에는 다음과 같이 응답이 나왔습니다.

root@Clearlinux/home/smallake # modprobe t4_tom
Killed

이유가 무엇인지 확인하기 위하여 dmesg 명령어를 실행하였습니다.

2.
위 로그를 보면 다음과 같은 부분이 보입니다.

[ 53.136716] BUG: unable to handle page fault for address: ffffffff82297f80
[ 53.143701] #PF: supervisor instruction fetch in kernel mode
[ 53.149447] #PF: error_code(0x0010) – not-present page
[ 53.154664] PGD 176013067 P4D 176013067 PUD 176014063 PMD 0

관련한 메시지를 검색하면 이런 응답이 있습니다. 물로 t4_tom module은 아닙니다.

Getting a “BUG” exception taints the kernel. In this case it would have been tainted already though. G – there is a non GPL module loaded. D – Oops or Bug occurred. The process executing when the exception occurred was rsync (Comm name of process)

The supervisor read access in kernel mode message on such a page fault error is common. (Not saying I understand it… just that I’ve seen it lots)

It could be a bug in the kernel, or a module that’s loaded, or chipset/memory issues. I’d be less confident that it’s a module, as it looks like a page cache read that failed.
P.S. I’d probably try a different kernel first, and see if the problem occurs.
BUG: unable to handle page fault중에서

커널 혹은 모듈의 버그라고 해서 clear Linux의 다른 버전, RHEL 8버전이 사용하는 커널로 해보았지만 결과는 다르지 않았습니다. 결과적으로 실패.

이제 남은 시험은 Solarflare와 Mellanox입니다.

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.