Algorithm 1. Framework of proposed P2P

Require: previous model $M_{t - 1}$ , a batch dataset $D = {x_{i}, y_{i}}_{i = 1}^{n}$ , the probability threshold p, the number of iterators k, learning rate $α$ .

Ensure: A translated dataset $D_{t r a n s}$ , a private domain dataset $D_{p r i}$ , a public domain dataset $D_{p u b}$ .

1. Freeze $M_{t - 1}$

2. Compute the predicted probability distribution for $D : P = Softmax (M_{t - 1} (x))$

3. Divide $D : D_{p u b} = {(x_{i}, y_{i}) | P_{y_{i}} \geq p}, D_{t r a n s} = {(x_{i}, y_{i}) | P_{y_{i}} < p}$

4. For $x \in D_{p r i}$ , initialize $x^{*} = x + δ$ with a small random noise $δ$

5. for $i t e r = 1$ to k do

6. $δ = \nabla_{x^{*}} [L_{cross-entropy} (θ_{t - 1}; x^{*}, y)]$

7. $x^{*} = x^{*} - α \frac{1}{{‖ δ ‖}_{2}}$

8. end for

9. $D_{t r a n s} = {(x^{*}, y) | \bar{y} (x^{*}, θ_{t - 1}) = y}$

10. Return $D_{t r a n s}$ , $D_{p r i}$ , $D_{p u b}$