首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >编写一个等价于mul/imul的VOP

编写一个等价于mul/imul的VOP
EN

Stack Overflow用户
提问于 2020-06-20 18:02:00
回答 1查看 158关注 0票数 6

因此,mul和imul指令都会将机器字相乘,并将结果和溢出存储在某些寄存器中(参见本例https://c9x.me/x86/html/file_module_x86_id_210.html)。我正在尝试编写一个vop,它将充分利用这些信息,并返回2个值。这个是可能的吗?我找不到任何关于如何让vop返回多个值的信息。如果有人能展示整个事情的例子,我也会很感激。

编辑:所以我想出了一些东西,但它仍然不够好。我会把它贴在这里,然后解释问题。

代码语言:javascript
复制
(defpackage #:fixmul
  (:use #:CL)
  (:export #:fixmul))

(in-package #:fixmul)


(sb-c:defknown fixmul (fixnum fixnum) (values fixnum fixnum &optional)
    (sb-c:foldable sb-c:flushable sb-c:movable)
  :overwrite-fndb-silently t)

(in-package #:sb-vm)

(define-vop (fixmul:fixmul)
  (:policy :fast-safe)
  (:translate fixmul:fixmul)
  (:args (x :scs (signed-reg) :target eax)
         (y :scs (signed-reg signed-stack)))
  (:arg-types fixnum fixnum)
  (:args-var args)
  (:temporary (:sc signed-reg :offset eax-offset :target quo
               :from (:argument 0) :to (:result 0)) eax)
  (:temporary (:sc signed-reg :offset edx-offset :target rem
               :from (:argument 0) :to (:result 1)) edx)
  (:results (quo :scs (signed-reg))
            (rem :scs (signed-reg)))
  (:result-types fixnum fixnum)
  (:note "inline (unsigned-byte 64) arithmetic")
  (:vop-var vop)
  (:save-p :compute-only)
  (:generator 5
              (move eax x)
              (inst mul eax y)
              (move quo eax)
              (move rem edx)))

(in-package #:fixmul)

(defun fixmul (a b)
  (fixmul a b))

因此,这段代码分解为:

代码语言:javascript
复制
> (disassemble 'fixmul)
; disassembly for FIXMUL
; Size: 35 bytes. Origin: #x52C42F4F                          ; FIXMUL
; 4F:       48F7E7           MUL RAX, RDI
; 52:       488BFA           MOV RDI, RDX
; 55:       48D1E0           SHL RAX, 1
; 58:       48D1E7           SHL RDI, 1
; 5B:       488BD0           MOV RDX, RAX
; 5E:       488D5D10         LEA RBX, [RBP+16]
; 62:       B904000000       MOV ECX, 4
; 67:       BE17001050       MOV ESI, #x50100017              ; NIL
; 6C:       F9               STC
; 6D:       488BE5           MOV RSP, RBP
; 70:       5D               POP RBP
; 71:       C3               RET
NIL

这还不错,但是我不理解我在sbcl端所做的大部分事情--为什么我会得到这个LEA、RBP+16和MOV,#x50100017

说明?

EDIT2:看起来这些指令主要是关于返回2个值。然而,从某种意义上说,整个事情都是有问题的,因为它使用了CL本机fixnums等,而不仅仅是原始的机器单词。我不确定如何解决这个问题,这就是为什么我不给自己一个答案。

EN

回答 1

Stack Overflow用户

发布于 2020-07-26 03:17:55

尝试:

代码语言:javascript
复制
(defpackage #:fixmul
  (:use #:CL)
  (:export #:fixmul))

(in-package #:fixmul)

(sb-c:defknown fixmul ((signed-byte 64) (signed-byte 64)) 
               (values (signed-byte 64) (signed-byte 64) &optional)
               (sb-c:foldable sb-c:flushable sb-c:movable))

(in-package #:sb-vm)

(define-vop (fixmul:fixmul)
  (:policy :fast-safe)
  (:translate fixmul:fixmul)
  (:args (x :scs (signed-reg) :target eax)
         (y :scs (signed-reg signed-stack)))
  (:arg-types signed-num signed-num)
  ; (:args-var args)
  (:temporary (:sc signed-reg :offset eax-offset :target quo
               :from (:argument 0) :to (:result 0)) eax)
  (:temporary (:sc signed-reg :offset edx-offset :target rem
               :from (:argument 0) :to (:result 1)) edx)
  (:results (quo :scs (signed-reg))
            (rem :scs (signed-reg)))
  (:result-types signed-num signed-num)
  (:note "inline (unsigned-byte 64) arithmetic")
  (:vop-var vop)
  (:save-p :compute-only)
  (:generator 5
              (move eax x)
              (inst mul eax y)
              (move quo eax)
              (move rem edx)))

(in-package #:fixmul)

(defun fixmul (a b)
  (fixmul a b))

现在:(反汇编'fixmul)

显示:

代码语言:javascript
复制
; disassembly for FIXMUL
; 02E2D561:       498BC0           MOV RAX, R8                ; no-arg-parsing entry point
;       64:       49F7E1           MUL RAX, R9
;       67:       488BCA           MOV RCX, RDX
;       6A:       486BD002         IMUL RDX, RAX, 2
;       6E:       710E             JNO L0
;       70:       488BD0           MOV RDX, RAX
;       73:       4C8D1C2540060020 LEA R11, [#x20000640]      ; ALLOC-SIGNED-BIGNUM-IN-RDX
;       7B:       41FFD3           CALL R11
;       7E: L0:   486BF902         IMUL RDI, RCX, 2
;       82:       710E             JNO L1
;       84:       488BF9           MOV RDI, RCX
;       87:       4C8D1C2518070020 LEA R11, [#x20000718]      ; ALLOC-SIGNED-BIGNUM-IN-RDI
;       8F:       41FFD3           CALL R11
;       92: L1:   488D5D10         LEA RBX, [RBP+16]
;       96:       B904000000       MOV ECX, 4
;       9B:       BE17001020       MOV ESI, 537919511
;       A0:       F9               STC
;       A1:       488BE5           MOV RSP, RBP
;       A4:       5D               POP RBP
;       A5:       C3               RET
;       A6:       0F0B0A           BREAK 10                   ; error trap
;       A9:       02               BYTE #X02
;       AA:       18               BYTE #X18                  ; INVALID-ARG-COUNT-ERROR
;       AB:       54               BYTE #X54                  ; RCX
NIL

如您所见,

; 73: 4C8D1C2540060020 LEA R11, [#x20000640] ; ALLOC-SIGNED-BIGNUM-IN-RDX

; 87: 4C8D1C2518070020 LEA R11, [#x20000718] ; ALLOC-SIGNED-BIGNUM-IN-RDI

分配了一个为(and integer (not fixnum))bignum。因为我使用的是64位系统,所以在一个机器字中包含一个bignum。反汇编在32位系统上会有所不同。在这种情况下,您可以在sb-c:defknown fixmul中指定(signed-byte 32)

您的结果类型和arg类型也可以不同(这样,如果您知道您的输入值将很小,那么您仍然可以获得接近最大(signed-byte 32)的值的结果。):

代码语言:javascript
复制
(sb-c:defknown fixmul ((signed-byte 32) (signed-byte 32)) 
               (values (signed-byte 64) (signed-byte 64) &optional)
               (sb-c:foldable sb-c:flushable sb-c:movable))

一些测试:

代码语言:javascript
复制
(fixmul 10000000000000000 100000000000000000)

> 4089650035136921600
  54210108624275


(fixmul 20 -200000)

> -4000000
  19

注意:为了让我的代码正常工作,我不得不注释掉(:args-var args)并去掉了:overwrite-fndb-silently t。这可能是因为我的sbcl和你的sbcl版本不同。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62484325

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档