jdk-sandbox: src/hotspot/cpu/arm/stubGenerator_arm.cpp@4f9683bf0923 (annotated)

42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1	/*
47658 c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2	* Copyright (c) 2008, 2017, Oracle and/or its affiliates. All rights reserved.
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3	* DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4	*
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	5	* This code is free software; you can redistribute it and/or modify it
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	6	* under the terms of the GNU General Public License version 2 only, as
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	7	* published by the Free Software Foundation.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	8	*
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	9	* This code is distributed in the hope that it will be useful, but WITHOUT
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	10	* ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	11	* FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	12	* version 2 for more details (a copy is included in the LICENSE file that
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	13	* accompanied this code).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	14	*
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	15	* You should have received a copy of the GNU General Public License version
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	16	* 2 along with this work; if not, write to the Free Software Foundation,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	17	* Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301 USA.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	18	*
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	19	* Please contact Oracle, 500 Oracle Parkway, Redwood Shores, CA 94065 USA
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	20	* or visit www.oracle.com if you need additional information or have any
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	21	* questions.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	22	*
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	23	*/
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	24
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	25	#include "precompiled.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	26	#include "asm/assembler.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	27	#include "assembler_arm.inline.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	28	#include "interpreter/interpreter.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	29	#include "nativeInst_arm.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	30	#include "oops/instanceOop.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	31	#include "oops/method.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	32	#include "oops/objArrayKlass.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	33	#include "oops/oop.inline.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	34	#include "prims/methodHandles.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	35	#include "runtime/frame.inline.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	36	#include "runtime/handles.inline.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	37	#include "runtime/sharedRuntime.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	38	#include "runtime/stubCodeGenerator.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	39	#include "runtime/stubRoutines.hpp"
46625 edefffab74e2 8183552: Move align functions to align.hpp stefank parents: 46620 diff changeset	40	#include "utilities/align.hpp"
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	41	#ifdef COMPILER2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	42	#include "opto/runtime.hpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	43	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	44
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	45	// Declaration and definition of StubGenerator (no .hpp file).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	46	// For a more detailed description of the stub routine structure
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	47	// see the comment in stubRoutines.hpp
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	48
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	49	#define __ _masm->
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	50
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	51	#ifdef PRODUCT
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	52	#define BLOCK_COMMENT(str) /* nothing */
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	53	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	54	#define BLOCK_COMMENT(str) __ block_comment(str)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	55	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	56
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	57	#define BIND(label) bind(label); BLOCK_COMMENT(#label ":")
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	58
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	59	// -------------------------------------------------------------------------------------------------------------------------
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	60	// Stub Code definitions
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	61
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	62	// Platform dependent parameters for array copy stubs
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	63
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	64	// Note: we have noticed a huge change in behavior on a microbenchmark
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	65	// from platform to platform depending on the configuration.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	66
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	67	// Instead of adding a series of command line options (which
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	68	// unfortunately have to be done in the shared file and cannot appear
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	69	// only in the ARM port), the tested result are hard-coded here in a set
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	70	// of options, selected by specifying 'ArmCopyPlatform'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	71
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	72	// Currently, this 'platform' is hardcoded to a value that is a good
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	73	// enough trade-off. However, one can easily modify this file to test
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	74	// the hard-coded configurations or create new ones. If the gain is
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	75	// significant, we could decide to either add command line options or
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	76	// add code to automatically choose a configuration.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	77
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	78	// see comments below for the various configurations created
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	79	#define DEFAULT_ARRAYCOPY_CONFIG 0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	80	#define TEGRA2_ARRAYCOPY_CONFIG 1
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	81	#define IMX515_ARRAYCOPY_CONFIG 2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	82
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	83	// Hard coded choices (XXX: could be changed to a command line option)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	84	#define ArmCopyPlatform DEFAULT_ARRAYCOPY_CONFIG
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	85
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	86	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	87	#define ArmCopyCacheLineSize 64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	88	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	89	#define ArmCopyCacheLineSize 32 // not worth optimizing to 64 according to measured gains
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	90	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	91
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	92	// TODO-AARCH64: tune and revise AArch64 arraycopy optimizations
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	93
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	94	// configuration for each kind of loop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	95	typedef struct {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	96	int pld_distance; // prefetch distance (0 => no prefetch, <0: prefetch_before);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	97	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	98	bool split_ldm; // if true, split each STM in STMs with fewer registers
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	99	bool split_stm; // if true, split each LTM in LTMs with fewer registers
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	100	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	101	} arraycopy_loop_config;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	102
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	103	// configuration for all loops
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	104	typedef struct {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	105	// const char *description;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	106	arraycopy_loop_config forward_aligned;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	107	arraycopy_loop_config backward_aligned;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	108	arraycopy_loop_config forward_shifted;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	109	arraycopy_loop_config backward_shifted;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	110	} arraycopy_platform_config;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	111
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	112	// configured platforms
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	113	static arraycopy_platform_config arraycopy_configurations[] = {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	114	// configuration parameters for arraycopy loops
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	115	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	116	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	117	{-256 }, // forward aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	118	{-128 }, // backward aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	119	{-256 }, // forward shifted
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	120	{-128 } // backward shifted
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	121	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	122	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	123
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	124	// Configurations were chosen based on manual analysis of benchmark
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	125	// results, minimizing overhead with respect to best results on the
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	126	// different test cases.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	127
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	128	// Prefetch before is always favored since it avoids dirtying the
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	129	// cache uselessly for small copies. Code for prefetch after has
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	130	// been kept in case the difference is significant for some
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	131	// platforms but we might consider dropping it.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	132
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	133	// distance, ldm, stm
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	134	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	135	// default: tradeoff tegra2/imx515/nv-tegra2,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	136	// Notes on benchmarking:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	137	// - not far from optimal configuration on nv-tegra2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	138	// - within 5% of optimal configuration except for backward aligned on IMX
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	139	// - up to 40% from optimal configuration for backward shifted and backward align for tegra2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	140	// but still on par with the operating system copy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	141	{-256, true, true }, // forward aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	142	{-256, true, true }, // backward aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	143	{-256, false, false }, // forward shifted
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	144	{-256, true, true } // backward shifted
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	145	},
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	146	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	147	// configuration tuned on tegra2-4.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	148	// Warning: should not be used on nv-tegra2 !
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	149	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	150	// - prefetch after gives 40% gain on backward copies on tegra2-4,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	151	// resulting in better number than the operating system
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	152	// copy. However, this can lead to a 300% loss on nv-tegra and has
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	153	// more impact on the cache (fetches futher than what is
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	154	// copied). Use this configuration with care, in case it improves
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	155	// reference benchmarks.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	156	{-256, true, true }, // forward aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	157	{96, false, false }, // backward aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	158	{-256, false, false }, // forward shifted
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	159	{96, false, false } // backward shifted
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	160	},
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	161	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	162	// configuration tuned on imx515
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	163	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	164	// - smaller prefetch distance is sufficient to get good result and might be more stable
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	165	// - refined backward aligned options within 5% of optimal configuration except for
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	166	// tests were the arrays fit in the cache
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	167	{-160, false, false }, // forward aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	168	{-160, false, false }, // backward aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	169	{-160, false, false }, // forward shifted
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	170	{-160, true, true } // backward shifted
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	171	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	172	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	173	};
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	174
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	175	class StubGenerator: public StubCodeGenerator {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	176
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	177	#ifdef PRODUCT
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	178	#define inc_counter_np(a,b,c) ((void)0)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	179	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	180	#define inc_counter_np(counter, t1, t2) \
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	181	BLOCK_COMMENT("inc_counter " #counter); \
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	182	__ inc_counter(&counter, t1, t2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	183	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	184
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	185	private:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	186
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	187	address generate_call_stub(address& return_address) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	188	StubCodeMark mark(this, "StubRoutines", "call_stub");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	189	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	190
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	191	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	192	const int saved_regs_size = 192;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	193
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	194	__ stp(FP, LR, Address(SP, -saved_regs_size, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	195	__ mov(FP, SP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	196
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	197	int sp_offset = 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	198	assert(frame::entry_frame_call_wrapper_offset * wordSize == sp_offset, "adjust this code");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	199	__ stp(R0, ZR, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	200
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	201	const int saved_result_and_result_type_offset = sp_offset;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	202	__ stp(R1, R2, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	203	__ stp(R19, R20, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	204	__ stp(R21, R22, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	205	__ stp(R23, R24, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	206	__ stp(R25, R26, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	207	__ stp(R27, R28, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	208
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	209	__ stp_d(V8, V9, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	210	__ stp_d(V10, V11, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	211	__ stp_d(V12, V13, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	212	__ stp_d(V14, V15, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	213	assert (sp_offset == saved_regs_size, "adjust this code");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	214
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	215	__ mov(Rmethod, R3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	216	__ mov(Rthread, R7);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	217	__ reinit_heapbase();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	218
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	219	{ // Pass parameters
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	220	Label done_parameters, pass_parameters;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	221
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	222	__ mov(Rparams, SP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	223	__ cbz_w(R6, done_parameters);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	224
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	225	__ sub(Rtemp, SP, R6, ex_uxtw, LogBytesPerWord);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	226	__ align_reg(SP, Rtemp, StackAlignmentInBytes);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	227	__ add(Rparams, SP, R6, ex_uxtw, LogBytesPerWord);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	228
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	229	__ bind(pass_parameters);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	230	__ subs_w(R6, R6, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	231	__ ldr(Rtemp, Address(R5, wordSize, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	232	__ str(Rtemp, Address(Rparams, -wordSize, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	233	__ b(pass_parameters, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	234
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	235	__ bind(done_parameters);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	236
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	237	#ifdef ASSERT
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	238	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	239	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	240	__ cmp(SP, Rparams);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	241	__ b(L, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	242	__ stop("SP does not match Rparams");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	243	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	244	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	245	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	246	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	247
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	248	__ mov(Rsender_sp, SP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	249	__ blr(R4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	250	return_address = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	251
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	252	__ mov(SP, FP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	253
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	254	__ ldp(R1, R2, Address(SP, saved_result_and_result_type_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	255
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	256	{ // Handle return value
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	257	Label cont;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	258	__ str(R0, Address(R1));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	259
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	260	__ cmp_w(R2, T_DOUBLE);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	261	__ ccmp_w(R2, T_FLOAT, Assembler::flags_for_condition(eq), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	262	__ b(cont, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	263
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	264	__ str_d(V0, Address(R1));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	265	__ bind(cont);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	266	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	267
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	268	sp_offset = saved_result_and_result_type_offset + 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	269	__ ldp(R19, R20, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	270	__ ldp(R21, R22, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	271	__ ldp(R23, R24, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	272	__ ldp(R25, R26, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	273	__ ldp(R27, R28, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	274
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	275	__ ldp_d(V8, V9, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	276	__ ldp_d(V10, V11, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	277	__ ldp_d(V12, V13, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	278	__ ldp_d(V14, V15, Address(SP, sp_offset)); sp_offset += 16;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	279	assert (sp_offset == saved_regs_size, "adjust this code");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	280
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	281	__ ldp(FP, LR, Address(SP, saved_regs_size, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	282	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	283
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	284	#else // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	285
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	286	assert(frame::entry_frame_call_wrapper_offset == 0, "adjust this code");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	287
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	288	__ mov(Rtemp, SP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	289	__ push(RegisterSet(FP) \| RegisterSet(LR));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	290	#ifndef __SOFTFP__
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	291	__ fstmdbd(SP, FloatRegisterSet(D8, 8), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	292	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	293	__ stmdb(SP, RegisterSet(R0, R2) \| RegisterSet(R4, R6) \| RegisterSet(R8, R10) \| altFP_7_11, writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	294	__ mov(Rmethod, R3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	295	__ ldmia(Rtemp, RegisterSet(R1, R3) \| Rthread); // stacked arguments
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	296
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	297	// XXX: TODO
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	298	// Would be better with respect to native tools if the following
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	299	// setting of FP was changed to conform to the native ABI, with FP
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	300	// pointing to the saved FP slot (and the corresponding modifications
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	301	// for entry_frame_call_wrapper_offset and frame::real_fp).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	302	__ mov(FP, SP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	303
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	304	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	305	Label no_parameters, pass_parameters;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	306	__ cmp(R3, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	307	__ b(no_parameters, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	308
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	309	__ bind(pass_parameters);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	310	__ ldr(Rtemp, Address(R2, wordSize, post_indexed)); // Rtemp OK, unused and scratchable
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	311	__ subs(R3, R3, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	312	__ push(Rtemp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	313	__ b(pass_parameters, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	314	__ bind(no_parameters);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	315	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	316
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	317	__ mov(Rsender_sp, SP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	318	__ blx(R1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	319	return_address = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	320
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	321	__ add(SP, FP, wordSize); // Skip link to JavaCallWrapper
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	322	__ pop(RegisterSet(R2, R3));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	323	#ifndef __ABI_HARD__
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	324	__ cmp(R3, T_LONG);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	325	__ cmp(R3, T_DOUBLE, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	326	__ str(R0, Address(R2));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	327	__ str(R1, Address(R2, wordSize), eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	328	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	329	Label cont, l_float, l_double;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	330
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	331	__ cmp(R3, T_DOUBLE);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	332	__ b(l_double, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	333
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	334	__ cmp(R3, T_FLOAT);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	335	__ b(l_float, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	336
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	337	__ cmp(R3, T_LONG);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	338	__ str(R0, Address(R2));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	339	__ str(R1, Address(R2, wordSize), eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	340	__ b(cont);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	341
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	342
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	343	__ bind(l_double);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	344	__ fstd(D0, Address(R2));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	345	__ b(cont);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	346
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	347	__ bind(l_float);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	348	__ fsts(S0, Address(R2));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	349
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	350	__ bind(cont);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	351	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	352
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	353	__ pop(RegisterSet(R4, R6) \| RegisterSet(R8, R10) \| altFP_7_11);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	354	#ifndef __SOFTFP__
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	355	__ fldmiad(SP, FloatRegisterSet(D8, 8), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	356	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	357	__ pop(RegisterSet(FP) \| RegisterSet(PC));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	358
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	359	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	360	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	361	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	362
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	363
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	364	// (in) Rexception_obj: exception oop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	365	address generate_catch_exception() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	366	StubCodeMark mark(this, "StubRoutines", "catch_exception");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	367	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	368
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	369	__ str(Rexception_obj, Address(Rthread, Thread::pending_exception_offset()));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	370	__ b(StubRoutines::_call_stub_return_address);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	371
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	372	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	373	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	374
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	375
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	376	// (in) Rexception_pc: return address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	377	address generate_forward_exception() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	378	StubCodeMark mark(this, "StubRoutines", "forward exception");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	379	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	380
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	381	__ mov(c_rarg0, Rthread);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	382	__ mov(c_rarg1, Rexception_pc);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	383	__ call_VM_leaf(CAST_FROM_FN_PTR(address,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	384	SharedRuntime::exception_handler_for_return_address),
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	385	c_rarg0, c_rarg1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	386	__ ldr(Rexception_obj, Address(Rthread, Thread::pending_exception_offset()));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	387	const Register Rzero = __ zero_register(Rtemp); // Rtemp OK (cleared by above call)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	388	__ str(Rzero, Address(Rthread, Thread::pending_exception_offset()));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	389
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	390	#ifdef ASSERT
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	391	// make sure exception is set
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	392	{ Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	393	__ cbnz(Rexception_obj, L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	394	__ stop("StubRoutines::forward exception: no pending exception (2)");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	395	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	396	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	397	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	398
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	399	// Verify that there is really a valid exception in RAX.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	400	__ verify_oop(Rexception_obj);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	401
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	402	__ jump(R0); // handler is returned in R0 by runtime function
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	403	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	404	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	405
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	406
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	407	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	408
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	409	// Integer division shared routine
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	410	// Input:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	411	// R0 - dividend
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	412	// R2 - divisor
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	413	// Output:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	414	// R0 - remainder
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	415	// R1 - quotient
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	416	// Destroys:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	417	// R2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	418	// LR
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	419	address generate_idiv_irem() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	420	Label positive_arguments, negative_or_zero, call_slow_path;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	421	Register dividend = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	422	Register divisor = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	423	Register remainder = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	424	Register quotient = R1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	425	Register tmp = LR;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	426	assert(dividend == remainder, "must be");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	427
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	428	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	429
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	430	// Check for special cases: divisor <= 0 or dividend < 0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	431	__ cmp(divisor, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	432	__ orrs(quotient, dividend, divisor, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	433	__ b(negative_or_zero, le);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	434
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	435	__ bind(positive_arguments);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	436	// Save return address on stack to free one extra register
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	437	__ push(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	438	// Approximate the mamximum order of the quotient
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	439	__ clz(tmp, dividend);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	440	__ clz(quotient, divisor);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	441	__ subs(tmp, quotient, tmp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	442	__ mov(quotient, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	443	// Jump to the appropriate place in the unrolled loop below
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	444	__ ldr(PC, Address(PC, tmp, lsl, 2), pl);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	445	// If divisor is greater than dividend, return immediately
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	446	__ pop(PC);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	447
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	448	// Offset table
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	449	Label offset_table[32];
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	450	int i;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	451	for (i = 0; i <= 31; i++) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	452	__ emit_address(offset_table[i]);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	453	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	454
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	455	// Unrolled loop of 32 division steps
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	456	for (i = 31; i >= 0; i--) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	457	__ bind(offset_table[i]);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	458	__ cmp(remainder, AsmOperand(divisor, lsl, i));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	459	__ sub(remainder, remainder, AsmOperand(divisor, lsl, i), hs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	460	__ add(quotient, quotient, 1 << i, hs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	461	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	462	__ pop(PC);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	463
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	464	__ bind(negative_or_zero);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	465	// Find the combination of argument signs and jump to corresponding handler
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	466	__ andr(quotient, dividend, 0x80000000, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	467	__ orr(quotient, quotient, AsmOperand(divisor, lsr, 31), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	468	__ add(PC, PC, AsmOperand(quotient, ror, 26), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	469	__ str(LR, Address(Rthread, JavaThread::saved_exception_pc_offset()));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	470
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	471	// The leaf runtime function can destroy R0-R3 and R12 registers which are still alive
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	472	RegisterSet saved_registers = RegisterSet(R3) \| RegisterSet(R12);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	473	#if R9_IS_SCRATCHED
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	474	// Safer to save R9 here since callers may have been written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	475	// assuming R9 survives. This is suboptimal but may not be worth
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	476	// revisiting for this slow case.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	477
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	478	// save also R10 for alignment
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	479	saved_registers = saved_registers \| RegisterSet(R9, R10);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	480	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	481	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	482	// divisor == 0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	483	FixedSizeCodeBlock zero_divisor(_masm, 8, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	484	__ push(saved_registers);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	485	__ mov(R0, Rthread);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	486	__ mov(R1, LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	487	__ mov(R2, SharedRuntime::IMPLICIT_DIVIDE_BY_ZERO);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	488	__ b(call_slow_path);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	489	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	490
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	491	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	492	// divisor > 0 && dividend < 0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	493	FixedSizeCodeBlock positive_divisor_negative_dividend(_masm, 8, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	494	__ push(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	495	__ rsb(dividend, dividend, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	496	__ bl(positive_arguments);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	497	__ rsb(remainder, remainder, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	498	__ rsb(quotient, quotient, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	499	__ pop(PC);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	500	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	501
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	502	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	503	// divisor < 0 && dividend > 0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	504	FixedSizeCodeBlock negative_divisor_positive_dividend(_masm, 8, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	505	__ push(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	506	__ rsb(divisor, divisor, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	507	__ bl(positive_arguments);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	508	__ rsb(quotient, quotient, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	509	__ pop(PC);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	510	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	511
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	512	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	513	// divisor < 0 && dividend < 0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	514	FixedSizeCodeBlock negative_divisor_negative_dividend(_masm, 8, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	515	__ push(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	516	__ rsb(dividend, dividend, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	517	__ rsb(divisor, divisor, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	518	__ bl(positive_arguments);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	519	__ rsb(remainder, remainder, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	520	__ pop(PC);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	521	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	522
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	523	__ bind(call_slow_path);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	524	__ call(CAST_FROM_FN_PTR(address, SharedRuntime::continuation_for_implicit_exception));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	525	__ pop(saved_registers);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	526	__ bx(R0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	527
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	528	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	529	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	530
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	531
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	532	// As per atomic.hpp the Atomic read-modify-write operations must be logically implemented as:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	533	// <fence>; <op>; <membar StoreLoad\|StoreStore>
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	534	// But for load-linked/store-conditional based systems a fence here simply means
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	535	// no load/store can be reordered with respect to the initial load-linked, so we have:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	536	// <membar storeload\|loadload> ; load-linked; <op>; store-conditional; <membar storeload\|storestore>
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	537	// There are no memory actions in <op> so nothing further is needed.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	538	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	539	// So we define the following for convenience:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	540	#define MEMBAR_ATOMIC_OP_PRE \
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	541	MacroAssembler::Membar_mask_bits(MacroAssembler::StoreLoad\|MacroAssembler::LoadLoad)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	542	#define MEMBAR_ATOMIC_OP_POST \
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	543	MacroAssembler::Membar_mask_bits(MacroAssembler::StoreLoad\|MacroAssembler::StoreStore)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	544
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	545	// Note: JDK 9 only supports ARMv7+ so we always have ldrexd available even though the
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	546	// code below allows for it to be otherwise. The else clause indicates an ARMv5 system
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	547	// for which we do not support MP and so membars are not necessary. This ARMv5 code will
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	548	// be removed in the future.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	549
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	550	// Support for jint Atomic::add(jint add_value, volatile jint *dest)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	551	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	552	// Arguments :
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	553	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	554	// add_value: R0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	555	// dest: R1
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	556	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	557	// Results:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	558	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	559	// R0: the new stored in dest
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	560	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	561	// Overwrites:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	562	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	563	// R1, R2, R3
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	564	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	565	address generate_atomic_add() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	566	address start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	567
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	568	StubCodeMark mark(this, "StubRoutines", "atomic_add");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	569	Label retry;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	570	start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	571	Register addval = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	572	Register dest = R1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	573	Register prev = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	574	Register ok = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	575	Register newval = R3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	576
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	577	if (VM_Version::supports_ldrex()) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	578	__ membar(MEMBAR_ATOMIC_OP_PRE, prev);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	579	__ bind(retry);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	580	__ ldrex(newval, Address(dest));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	581	__ add(newval, addval, newval);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	582	__ strex(ok, newval, Address(dest));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	583	__ cmp(ok, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	584	__ b(retry, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	585	__ mov (R0, newval);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	586	__ membar(MEMBAR_ATOMIC_OP_POST, prev);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	587	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	588	__ bind(retry);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	589	__ ldr (prev, Address(dest));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	590	__ add(newval, addval, prev);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	591	__ atomic_cas_bool(prev, newval, dest, 0, noreg/ignored/);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	592	__ b(retry, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	593	__ mov (R0, newval);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	594	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	595	__ bx(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	596
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	597	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	598	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	599
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	600	// Support for jint Atomic::xchg(jint exchange_value, volatile jint *dest)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	601	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	602	// Arguments :
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	603	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	604	// exchange_value: R0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	605	// dest: R1
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	606	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	607	// Results:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	608	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	609	// R0: the value previously stored in dest
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	610	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	611	// Overwrites:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	612	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	613	// R1, R2, R3
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	614	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	615	address generate_atomic_xchg() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	616	address start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	617
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	618	StubCodeMark mark(this, "StubRoutines", "atomic_xchg");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	619	start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	620	Register newval = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	621	Register dest = R1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	622	Register prev = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	623
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	624	Label retry;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	625
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	626	if (VM_Version::supports_ldrex()) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	627	Register ok=R3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	628	__ membar(MEMBAR_ATOMIC_OP_PRE, prev);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	629	__ bind(retry);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	630	__ ldrex(prev, Address(dest));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	631	__ strex(ok, newval, Address(dest));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	632	__ cmp(ok, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	633	__ b(retry, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	634	__ mov (R0, prev);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	635	__ membar(MEMBAR_ATOMIC_OP_POST, prev);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	636	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	637	__ bind(retry);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	638	__ ldr (prev, Address(dest));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	639	__ atomic_cas_bool(prev, newval, dest, 0, noreg/ignored/);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	640	__ b(retry, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	641	__ mov (R0, prev);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	642	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	643	__ bx(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	644
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	645	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	646	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	647
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	648	// Support for jint Atomic::cmpxchg(jint exchange_value, volatile jint *dest, jint compare_value)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	649	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	650	// Arguments :
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	651	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	652	// compare_value: R0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	653	// exchange_value: R1
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	654	// dest: R2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	655	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	656	// Results:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	657	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	658	// R0: the value previously stored in dest
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	659	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	660	// Overwrites:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	661	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	662	// R0, R1, R2, R3, Rtemp
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	663	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	664	address generate_atomic_cmpxchg() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	665	address start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	666
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	667	StubCodeMark mark(this, "StubRoutines", "atomic_cmpxchg");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	668	start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	669	Register cmp = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	670	Register newval = R1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	671	Register dest = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	672	Register temp1 = R3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	673	Register temp2 = Rtemp; // Rtemp free (native ABI)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	674
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	675	__ membar(MEMBAR_ATOMIC_OP_PRE, temp1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	676
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	677	// atomic_cas returns previous value in R0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	678	__ atomic_cas(temp1, temp2, cmp, newval, dest, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	679
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	680	__ membar(MEMBAR_ATOMIC_OP_POST, temp1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	681
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	682	__ bx(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	683
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	684	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	685	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	686
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	687	// Support for jlong Atomic::cmpxchg(jlong exchange_value, volatile jlong *dest, jlong compare_value)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	688	// reordered before by a wrapper to (jlong compare_value, jlong exchange_value, volatile jlong *dest)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	689	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	690	// Arguments :
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	691	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	692	// compare_value: R1 (High), R0 (Low)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	693	// exchange_value: R3 (High), R2 (Low)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	694	// dest: SP+0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	695	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	696	// Results:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	697	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	698	// R0:R1: the value previously stored in dest
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	699	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	700	// Overwrites:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	701	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	702	address generate_atomic_cmpxchg_long() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	703	address start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	704
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	705	StubCodeMark mark(this, "StubRoutines", "atomic_cmpxchg_long");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	706	start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	707	Register cmp_lo = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	708	Register cmp_hi = R1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	709	Register newval_lo = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	710	Register newval_hi = R3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	711	Register addr = Rtemp; /* After load from stack */
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	712	Register temp_lo = R4;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	713	Register temp_hi = R5;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	714	Register temp_result = R8;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	715	assert_different_registers(cmp_lo, newval_lo, temp_lo, addr, temp_result, R7);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	716	assert_different_registers(cmp_hi, newval_hi, temp_hi, addr, temp_result, R7);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	717
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	718	__ membar(MEMBAR_ATOMIC_OP_PRE, Rtemp); // Rtemp free (native ABI)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	719
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	720	// Stack is unaligned, maintain double word alignment by pushing
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	721	// odd number of regs.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	722	__ push(RegisterSet(temp_result) \| RegisterSet(temp_lo, temp_hi));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	723	__ ldr(addr, Address(SP, 12));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	724
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	725	// atomic_cas64 returns previous value in temp_lo, temp_hi
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	726	__ atomic_cas64(temp_lo, temp_hi, temp_result, cmp_lo, cmp_hi,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	727	newval_lo, newval_hi, addr, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	728	__ mov(R0, temp_lo);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	729	__ mov(R1, temp_hi);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	730
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	731	__ pop(RegisterSet(temp_result) \| RegisterSet(temp_lo, temp_hi));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	732
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	733	__ membar(MEMBAR_ATOMIC_OP_POST, Rtemp); // Rtemp free (native ABI)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	734	__ bx(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	735
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	736	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	737	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	738
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	739	address generate_atomic_load_long() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	740	address start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	741
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	742	StubCodeMark mark(this, "StubRoutines", "atomic_load_long");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	743	start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	744	Register result_lo = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	745	Register result_hi = R1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	746	Register src = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	747
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	748	if (!os::is_MP()) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	749	__ ldmia(src, RegisterSet(result_lo, result_hi));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	750	__ bx(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	751	} else if (VM_Version::supports_ldrexd()) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	752	__ ldrexd(result_lo, Address(src));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	753	__ clrex(); // FIXME: safe to remove?
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	754	__ bx(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	755	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	756	__ stop("Atomic load(jlong) unsupported on this platform");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	757	__ bx(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	758	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	759
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	760	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	761	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	762
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	763	address generate_atomic_store_long() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	764	address start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	765
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	766	StubCodeMark mark(this, "StubRoutines", "atomic_store_long");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	767	start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	768	Register newval_lo = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	769	Register newval_hi = R1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	770	Register dest = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	771	Register scratch_lo = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	772	Register scratch_hi = R3; /* After load from stack */
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	773	Register result = R3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	774
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	775	if (!os::is_MP()) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	776	__ stmia(dest, RegisterSet(newval_lo, newval_hi));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	777	__ bx(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	778	} else if (VM_Version::supports_ldrexd()) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	779	__ mov(Rtemp, dest); // get dest to Rtemp
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	780	Label retry;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	781	__ bind(retry);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	782	__ ldrexd(scratch_lo, Address(Rtemp));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	783	__ strexd(result, R0, Address(Rtemp));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	784	__ rsbs(result, result, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	785	__ b(retry, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	786	__ bx(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	787	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	788	__ stop("Atomic store(jlong) unsupported on this platform");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	789	__ bx(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	790	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	791
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	792	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	793	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	794
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	795
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	796	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	797
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	798	#ifdef COMPILER2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	799	// Support for uint StubRoutine::Arm::partial_subtype_check( Klass sub, Klass super );
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	800	// Arguments :
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	801	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	802	// ret : R0, returned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	803	// icc/xcc: set as R0 (depending on wordSize)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	804	// sub : R1, argument, not changed
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	805	// super: R2, argument, not changed
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	806	// raddr: LR, blown by call
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	807	address generate_partial_subtype_check() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	808	__ align(CodeEntryAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	809	StubCodeMark mark(this, "StubRoutines", "partial_subtype_check");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	810	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	811
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	812	// based on SPARC check_klass_subtype_[fast\|slow]_path (without CompressedOops)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	813
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	814	// R0 used as tmp_reg (in addition to return reg)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	815	Register sub_klass = R1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	816	Register super_klass = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	817	Register tmp_reg2 = R3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	818	Register tmp_reg3 = R4;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	819	#define saved_set tmp_reg2, tmp_reg3
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	820
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	821	Label L_loop, L_fail;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	822
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	823	int sc_offset = in_bytes(Klass::secondary_super_cache_offset());
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	824
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	825	// fast check should be redundant
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	826
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	827	// slow check
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	828	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	829	__ raw_push(saved_set);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	830
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	831	// a couple of useful fields in sub_klass:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	832	int ss_offset = in_bytes(Klass::secondary_supers_offset());
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	833
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	834	// Do a linear scan of the secondary super-klass chain.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	835	// This code is rarely used, so simplicity is a virtue here.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	836
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	837	inc_counter_np(SharedRuntime::_partial_subtype_ctr, tmp_reg2, tmp_reg3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	838
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	839	Register scan_temp = tmp_reg2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	840	Register count_temp = tmp_reg3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	841
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	842	// We will consult the secondary-super array.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	843	__ ldr(scan_temp, Address(sub_klass, ss_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	844
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	845	Register search_key = super_klass;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	846
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	847	// Load the array length.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	848	__ ldr_s32(count_temp, Address(scan_temp, Array<Klass*>::length_offset_in_bytes()));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	849	__ add(scan_temp, scan_temp, Array<Klass*>::base_offset_in_bytes());
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	850
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	851	__ add(count_temp, count_temp, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	852
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	853	// Top of search loop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	854	__ bind(L_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	855	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	856	// scan_temp starts at the array elements
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	857	// count_temp is 1+size
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	858	__ subs(count_temp, count_temp, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	859	__ b(L_fail, eq); // not found in the array
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	860
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	861	// Load next super to check
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	862	// In the array of super classes elements are pointer sized.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	863	int element_size = wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	864	__ ldr(R0, Address(scan_temp, element_size, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	865
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	866	// Look for Rsuper_klass on Rsub_klass's secondary super-class-overflow list
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	867	__ subs(R0, R0, search_key); // set R0 to 0 on success (and flags to eq)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	868
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	869	// A miss means we are NOT a subtype and need to keep looping
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	870	__ b(L_loop, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	871
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	872	// Falling out the bottom means we found a hit; we ARE a subtype
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	873
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	874	// Success. Cache the super we found and proceed in triumph.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	875	__ str(super_klass, Address(sub_klass, sc_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	876
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	877	// Return success
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	878	// R0 is already 0 and flags are already set to eq
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	879	__ raw_pop(saved_set);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	880	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	881
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	882	// Return failure
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	883	__ bind(L_fail);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	884	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	885	// count_temp is 0, can't use ZR here
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	886	__ adds(R0, count_temp, 1); // sets the flags
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	887	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	888	__ movs(R0, 1); // sets the flags
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	889	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	890	__ raw_pop(saved_set);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	891	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	892	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	893	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	894	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	895	#undef saved_set
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	896	#endif // COMPILER2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	897
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	898
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	899	//----------------------------------------------------------------------------------------------------
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	900	// Non-destructive plausibility checks for oops
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	901
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	902	address generate_verify_oop() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	903	StubCodeMark mark(this, "StubRoutines", "verify_oop");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	904	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	905
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	906	// Incoming arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	907	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	908	// R0: error message (char* )
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	909	// R1: address of register save area
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	910	// R2: oop to verify
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	911	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	912	// All registers are saved before calling this stub. However, condition flags should be saved here.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	913
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	914	const Register oop = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	915	const Register klass = R3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	916	const Register tmp1 = R6;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	917	const Register tmp2 = R8;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	918
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	919	const Register flags = Rtmp_save0; // R4/R19
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	920	const Register ret_addr = Rtmp_save1; // R5/R20
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	921	assert_different_registers(oop, klass, tmp1, tmp2, flags, ret_addr, R7);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	922
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	923	Label exit, error;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	924	InlinedAddress verify_oop_count((address) StubRoutines::verify_oop_count_addr());
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	925
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	926	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	927	__ mrs(flags, Assembler::SysReg_NZCV);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	928	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	929	__ mrs(Assembler::CPSR, flags);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	930	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	931
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	932	__ ldr_literal(tmp1, verify_oop_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	933	__ ldr_s32(tmp2, Address(tmp1));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	934	__ add(tmp2, tmp2, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	935	__ str_32(tmp2, Address(tmp1));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	936
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	937	// make sure object is 'reasonable'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	938	__ cbz(oop, exit); // if obj is NULL it is ok
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	939
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	940	// Check if the oop is in the right area of memory
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	941	// Note: oop_mask and oop_bits must be updated if the code is saved/reused
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	942	const address oop_mask = (address) Universe::verify_oop_mask();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	943	const address oop_bits = (address) Universe::verify_oop_bits();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	944	__ mov_address(tmp1, oop_mask, symbolic_Relocation::oop_mask_reference);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	945	__ andr(tmp2, oop, tmp1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	946	__ mov_address(tmp1, oop_bits, symbolic_Relocation::oop_bits_reference);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	947	__ cmp(tmp2, tmp1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	948	__ b(error, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	949
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	950	// make sure klass is 'reasonable'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	951	__ load_klass(klass, oop); // get klass
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	952	__ cbz(klass, error); // if klass is NULL it is broken
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	953
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	954	// return if everything seems ok
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	955	__ bind(exit);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	956
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	957	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	958	__ msr(Assembler::SysReg_NZCV, flags);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	959	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	960	__ msr(Assembler::CPSR_f, flags);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	961	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	962
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	963	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	964
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	965	// handle errors
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	966	__ bind(error);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	967
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	968	__ mov(ret_addr, LR); // save return address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	969
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	970	// R0: error message
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	971	// R1: register save area
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	972	__ call(CAST_FROM_FN_PTR(address, MacroAssembler::debug));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	973
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	974	__ mov(LR, ret_addr);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	975	__ b(exit);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	976
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	977	__ bind_literal(verify_oop_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	978
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	979	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	980	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	981
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	982	//----------------------------------------------------------------------------------------------------
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	983	// Array copy stubs
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	984
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	985	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	986	// Generate overlap test for array copy stubs
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	987	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	988	// Input:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	989	// R0 - array1
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	990	// R1 - array2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	991	// R2 - element count, 32-bit int
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	992	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	993	// input registers are preserved
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	994	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	995	void array_overlap_test(address no_overlap_target, int log2_elem_size, Register tmp1, Register tmp2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	996	assert(no_overlap_target != NULL, "must be generated");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	997	array_overlap_test(no_overlap_target, NULL, log2_elem_size, tmp1, tmp2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	998	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	999	void array_overlap_test(Label& L_no_overlap, int log2_elem_size, Register tmp1, Register tmp2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1000	array_overlap_test(NULL, &L_no_overlap, log2_elem_size, tmp1, tmp2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1001	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1002	void array_overlap_test(address no_overlap_target, Label* NOLp, int log2_elem_size, Register tmp1, Register tmp2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1003	const Register from = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1004	const Register to = R1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1005	const Register count = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1006	const Register to_from = tmp1; // to - from
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1007	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1008	const Register byte_count = (log2_elem_size == 0) ? count : tmp2; // count << log2_elem_size
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1009	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1010	assert_different_registers(from, to, count, tmp1, tmp2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1011
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1012	// no_overlap version works if 'to' lower (unsigned) than 'from'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1013	// and or 'to' more than (count*size) from 'from'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1014
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1015	BLOCK_COMMENT("Array Overlap Test:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1016	__ subs(to_from, to, from);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1017	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1018	if (log2_elem_size != 0) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1019	__ mov(byte_count, AsmOperand(count, lsl, log2_elem_size));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1020	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1021	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1022	if (NOLp == NULL)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1023	__ b(no_overlap_target,lo);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1024	else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1025	__ b((*NOLp), lo);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1026	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1027	__ subs(ZR, to_from, count, ex_sxtw, log2_elem_size);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1028	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1029	__ cmp(to_from, byte_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1030	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1031	if (NOLp == NULL)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1032	__ b(no_overlap_target, ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1033	else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1034	__ b((*NOLp), ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1035	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1036
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1037	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1038	// TODO-AARCH64: revise usages of bulk_* methods (probably ldp`s and stp`s should interlace)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1039
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1040	// Loads [from, from + count*wordSize) into regs[0], regs[1], ..., regs[count-1]
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1041	// and increases 'from' by count*wordSize.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1042	void bulk_load_forward(Register from, const Register regs[], int count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1043	assert (count > 0 && count % 2 == 0, "count must be positive even number");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1044	int bytes = count * wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1045
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1046	int offset = 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1047	__ ldp(regs[0], regs[1], Address(from, bytes, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1048	offset += 2*wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1049
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1050	for (int i = 2; i < count; i += 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1051	__ ldp(regs[i], regs[i+1], Address(from, -bytes + offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1052	offset += 2*wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1053	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1054
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1055	assert (offset == bytes, "must be");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1056	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1057
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1058	// Stores regs[0], regs[1], ..., regs[count-1] to [to, to + count*wordSize)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1059	// and increases 'to' by count*wordSize.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1060	void bulk_store_forward(Register to, const Register regs[], int count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1061	assert (count > 0 && count % 2 == 0, "count must be positive even number");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1062	int bytes = count * wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1063
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1064	int offset = 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1065	__ stp(regs[0], regs[1], Address(to, bytes, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1066	offset += 2*wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1067
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1068	for (int i = 2; i < count; i += 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1069	__ stp(regs[i], regs[i+1], Address(to, -bytes + offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1070	offset += 2*wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1071	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1072
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1073	assert (offset == bytes, "must be");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1074	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1075
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1076	// Loads [from - count*wordSize, from) into regs[0], regs[1], ..., regs[count-1]
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1077	// and decreases 'from' by count*wordSize.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1078	// Note that the word with lowest address goes to regs[0].
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1079	void bulk_load_backward(Register from, const Register regs[], int count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1080	assert (count > 0 && count % 2 == 0, "count must be positive even number");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1081	int bytes = count * wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1082
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1083	int offset = 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1084
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1085	for (int i = count - 2; i > 0; i -= 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1086	offset += 2*wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1087	__ ldp(regs[i], regs[i+1], Address(from, -offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1088	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1089
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1090	offset += 2*wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1091	__ ldp(regs[0], regs[1], Address(from, -bytes, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1092
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1093	assert (offset == bytes, "must be");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1094	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1095
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1096	// Stores regs[0], regs[1], ..., regs[count-1] into [to - count*wordSize, to)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1097	// and decreases 'to' by count*wordSize.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1098	// Note that regs[0] value goes into the memory with lowest address.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1099	void bulk_store_backward(Register to, const Register regs[], int count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1100	assert (count > 0 && count % 2 == 0, "count must be positive even number");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1101	int bytes = count * wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1102
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1103	int offset = 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1104
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1105	for (int i = count - 2; i > 0; i -= 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1106	offset += 2*wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1107	__ stp(regs[i], regs[i+1], Address(to, -offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1108	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1109
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1110	offset += 2*wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1111	__ stp(regs[0], regs[1], Address(to, -bytes, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1112
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1113	assert (offset == bytes, "must be");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1114	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1115	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1116
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1117	// TODO-AARCH64: rearrange in-loop prefetches:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1118	// probably we should choose between "prefetch-store before or after store", not "before or after load".
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1119	void prefetch(Register from, Register to, int offset, int to_delta = 0) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1120	__ prefetch_read(Address(from, offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1121	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1122	// Next line commented out to avoid significant loss of performance in memory copy - JDK-8078120
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1123	// __ prfm(pstl1keep, Address(to, offset + to_delta));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1124	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1125	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1126
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1127	// Generate the inner loop for forward aligned array copy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1128	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1129	// Arguments
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1130	// from: src address, 64 bits aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1131	// to: dst address, wordSize aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1132	// count: number of elements (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1133	// bytes_per_count: number of bytes for each unit of 'count'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1134	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1135	// Return the minimum initial value for count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1136	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1137	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1138	// - 'from' aligned on 64-bit (recommended for 32-bit ARM in case this speeds up LDMIA, required for AArch64)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1139	// - 'to' aligned on wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1140	// - 'count' must be greater or equal than the returned value
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1141	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1142	// Increases 'from' and 'to' by count*bytes_per_count.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1143	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1144	// Scratches 'count', R3.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1145	// On AArch64 also scratches R4-R10; on 32-bit ARM R4-R10 are preserved (saved/restored).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1146	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1147	int generate_forward_aligned_copy_loop(Register from, Register to, Register count, int bytes_per_count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1148	assert (from == R0 && to == R1 && count == R2, "adjust the implementation below");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1149
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1150	const int bytes_per_loop = 8*wordSize; // 8 registers are read and written on every loop iteration
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1151	arraycopy_loop_config *config=&arraycopy_configurations[ArmCopyPlatform].forward_aligned;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1152	int pld_offset = config->pld_distance;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1153	const int count_per_loop = bytes_per_loop / bytes_per_count;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1154
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1155	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1156	bool split_read= config->split_ldm;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1157	bool split_write= config->split_stm;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1158
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1159	// XXX optim: use VLDM/VSTM when available (Neon) with PLD
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1160	// NEONCopyPLD
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1161	// PLD [r1, #0xC0]
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1162	// VLDM r1!,{d0-d7}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1163	// VSTM r0!,{d0-d7}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1164	// SUBS r2,r2,#0x40
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1165	// BGE NEONCopyPLD
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1166
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1167	__ push(RegisterSet(R4,R10));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1168	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1169
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1170	const bool prefetch_before = pld_offset < 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1171	const bool prefetch_after = pld_offset > 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1172
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1173	Label L_skip_pld;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1174
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1175	// predecrease to exit when there is less than count_per_loop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1176	__ sub_32(count, count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1177
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1178	if (pld_offset != 0) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1179	pld_offset = (pld_offset < 0) ? -pld_offset : pld_offset;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1180
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1181	prefetch(from, to, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1182
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1183	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1184	// If prefetch is done ahead, final PLDs that overflow the
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1185	// copied area can be easily avoided. 'count' is predecreased
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1186	// by the prefetch distance to optimize the inner loop and the
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1187	// outer loop skips the PLD.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1188	__ subs_32(count, count, (bytes_per_loop+pld_offset)/bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1189
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1190	// skip prefetch for small copies
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1191	__ b(L_skip_pld, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1192	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1193
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1194	int offset = ArmCopyCacheLineSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1195	while (offset <= pld_offset) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1196	prefetch(from, to, offset);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1197	offset += ArmCopyCacheLineSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1198	};
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1199	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1200
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1201	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1202	const Register data_regs[8] = {R3, R4, R5, R6, R7, R8, R9, R10};
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1203	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1204	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1205	// LDM (32-bit ARM) / LDP (AArch64) copy of 'bytes_per_loop' bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1206
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1207	// 32-bit ARM note: we have tried implementing loop unrolling to skip one
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1208	// PLD with 64 bytes cache line but the gain was not significant.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1209
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1210	Label L_copy_loop;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1211	__ align(OptoLoopAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1212	__ BIND(L_copy_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1213
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1214	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1215	prefetch(from, to, bytes_per_loop + pld_offset);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1216	__ BIND(L_skip_pld);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1217	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1218
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1219	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1220	bulk_load_forward(from, data_regs, 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1221	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1222	if (split_read) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1223	// Split the register set in two sets so that there is less
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1224	// latency between LDM and STM (R3-R6 available while R7-R10
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1225	// still loading) and less register locking issue when iterating
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1226	// on the first LDM.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1227	__ ldmia(from, RegisterSet(R3, R6), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1228	__ ldmia(from, RegisterSet(R7, R10), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1229	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1230	__ ldmia(from, RegisterSet(R3, R10), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1231	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1232	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1233
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1234	__ subs_32(count, count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1235
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1236	if (prefetch_after) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1237	prefetch(from, to, pld_offset, bytes_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1238	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1239
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1240	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1241	bulk_store_forward(to, data_regs, 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1242	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1243	if (split_write) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1244	__ stmia(to, RegisterSet(R3, R6), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1245	__ stmia(to, RegisterSet(R7, R10), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1246	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1247	__ stmia(to, RegisterSet(R3, R10), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1248	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1249	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1250
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1251	__ b(L_copy_loop, ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1252
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1253	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1254	// the inner loop may end earlier, allowing to skip PLD for the last iterations
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1255	__ cmn_32(count, (bytes_per_loop + pld_offset)/bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1256	__ b(L_skip_pld, ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1257	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1258	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1259	BLOCK_COMMENT("Remaining bytes:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1260	// still 0..bytes_per_loop-1 aligned bytes to copy, count already decreased by (at least) bytes_per_loop bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1261
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1262	// __ add(count, count, ...); // addition useless for the bit tests
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1263	assert (pld_offset % bytes_per_loop == 0, "decreasing count by pld_offset before loop must not change tested bits");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1264
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1265	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1266	assert (bytes_per_loop == 64, "adjust the code below");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1267	assert (bytes_per_count <= 8, "adjust the code below");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1268
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1269	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1270	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1271	__ tbz(count, exact_log2(32/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1272
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1273	bulk_load_forward(from, data_regs, 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1274	bulk_store_forward(to, data_regs, 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1275
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1276	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1277	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1278
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1279	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1280	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1281	__ tbz(count, exact_log2(16/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1282
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1283	bulk_load_forward(from, data_regs, 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1284	bulk_store_forward(to, data_regs, 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1285
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1286	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1287	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1288
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1289	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1290	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1291	__ tbz(count, exact_log2(8/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1292
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1293	__ ldr(R3, Address(from, 8, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1294	__ str(R3, Address(to, 8, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1295
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1296	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1297	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1298
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1299	if (bytes_per_count <= 4) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1300	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1301	__ tbz(count, exact_log2(4/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1302
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1303	__ ldr_w(R3, Address(from, 4, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1304	__ str_w(R3, Address(to, 4, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1305
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1306	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1307	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1308
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1309	if (bytes_per_count <= 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1310	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1311	__ tbz(count, exact_log2(2/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1312
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1313	__ ldrh(R3, Address(from, 2, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1314	__ strh(R3, Address(to, 2, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1315
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1316	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1317	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1318
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1319	if (bytes_per_count <= 1) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1320	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1321	__ tbz(count, 0, L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1322
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1323	__ ldrb(R3, Address(from, 1, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1324	__ strb(R3, Address(to, 1, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1325
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1326	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1327	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1328	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1329	__ tst(count, 16 / bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1330	__ ldmia(from, RegisterSet(R3, R6), writeback, ne); // copy 16 bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1331	__ stmia(to, RegisterSet(R3, R6), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1332
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1333	__ tst(count, 8 / bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1334	__ ldmia(from, RegisterSet(R3, R4), writeback, ne); // copy 8 bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1335	__ stmia(to, RegisterSet(R3, R4), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1336
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1337	if (bytes_per_count <= 4) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1338	__ tst(count, 4 / bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1339	__ ldr(R3, Address(from, 4, post_indexed), ne); // copy 4 bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1340	__ str(R3, Address(to, 4, post_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1341	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1342
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1343	if (bytes_per_count <= 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1344	__ tst(count, 2 / bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1345	__ ldrh(R3, Address(from, 2, post_indexed), ne); // copy 2 bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1346	__ strh(R3, Address(to, 2, post_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1347	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1348
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1349	if (bytes_per_count == 1) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1350	__ tst(count, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1351	__ ldrb(R3, Address(from, 1, post_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1352	__ strb(R3, Address(to, 1, post_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1353	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1354
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1355	__ pop(RegisterSet(R4,R10));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1356	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1357
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1358	return count_per_loop;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1359	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1360
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1361
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1362	// Generate the inner loop for backward aligned array copy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1363	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1364	// Arguments
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1365	// end_from: src end address, 64 bits aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1366	// end_to: dst end address, wordSize aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1367	// count: number of elements (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1368	// bytes_per_count: number of bytes for each unit of 'count'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1369	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1370	// Return the minimum initial value for count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1371	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1372	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1373	// - 'end_from' aligned on 64-bit (recommended for 32-bit ARM in case this speeds up LDMIA, required for AArch64)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1374	// - 'end_to' aligned on wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1375	// - 'count' must be greater or equal than the returned value
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1376	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1377	// Decreases 'end_from' and 'end_to' by count*bytes_per_count.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1378	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1379	// Scratches 'count', R3.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1380	// On AArch64 also scratches R4-R10; on 32-bit ARM R4-R10 are preserved (saved/restored).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1381	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1382	int generate_backward_aligned_copy_loop(Register end_from, Register end_to, Register count, int bytes_per_count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1383	assert (end_from == R0 && end_to == R1 && count == R2, "adjust the implementation below");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1384
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1385	const int bytes_per_loop = 8*wordSize; // 8 registers are read and written on every loop iteration
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1386	const int count_per_loop = bytes_per_loop / bytes_per_count;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1387
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1388	arraycopy_loop_config *config=&arraycopy_configurations[ArmCopyPlatform].backward_aligned;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1389	int pld_offset = config->pld_distance;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1390
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1391	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1392	bool split_read= config->split_ldm;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1393	bool split_write= config->split_stm;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1394
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1395	// See the forward copy variant for additional comments.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1396
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1397	__ push(RegisterSet(R4,R10));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1398	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1399
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1400	__ sub_32(count, count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1401
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1402	const bool prefetch_before = pld_offset < 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1403	const bool prefetch_after = pld_offset > 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1404
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1405	Label L_skip_pld;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1406
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1407	if (pld_offset != 0) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1408	pld_offset = (pld_offset < 0) ? -pld_offset : pld_offset;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1409
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1410	prefetch(end_from, end_to, -wordSize);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1411
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1412	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1413	__ subs_32(count, count, (bytes_per_loop + pld_offset) / bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1414	__ b(L_skip_pld, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1415	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1416
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1417	int offset = ArmCopyCacheLineSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1418	while (offset <= pld_offset) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1419	prefetch(end_from, end_to, -(wordSize + offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1420	offset += ArmCopyCacheLineSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1421	};
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1422	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1423
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1424	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1425	const Register data_regs[8] = {R3, R4, R5, R6, R7, R8, R9, R10};
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1426	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1427	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1428	// LDM (32-bit ARM) / LDP (AArch64) copy of 'bytes_per_loop' bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1429
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1430	// 32-bit ARM note: we have tried implementing loop unrolling to skip one
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1431	// PLD with 64 bytes cache line but the gain was not significant.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1432
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1433	Label L_copy_loop;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1434	__ align(OptoLoopAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1435	__ BIND(L_copy_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1436
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1437	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1438	prefetch(end_from, end_to, -(wordSize + bytes_per_loop + pld_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1439	__ BIND(L_skip_pld);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1440	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1441
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1442	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1443	bulk_load_backward(end_from, data_regs, 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1444	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1445	if (split_read) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1446	__ ldmdb(end_from, RegisterSet(R7, R10), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1447	__ ldmdb(end_from, RegisterSet(R3, R6), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1448	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1449	__ ldmdb(end_from, RegisterSet(R3, R10), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1450	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1451	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1452
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1453	__ subs_32(count, count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1454
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1455	if (prefetch_after) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1456	prefetch(end_from, end_to, -(wordSize + pld_offset), -bytes_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1457	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1458
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1459	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1460	bulk_store_backward(end_to, data_regs, 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1461	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1462	if (split_write) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1463	__ stmdb(end_to, RegisterSet(R7, R10), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1464	__ stmdb(end_to, RegisterSet(R3, R6), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1465	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1466	__ stmdb(end_to, RegisterSet(R3, R10), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1467	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1468	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1469
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1470	__ b(L_copy_loop, ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1471
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1472	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1473	__ cmn_32(count, (bytes_per_loop + pld_offset)/bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1474	__ b(L_skip_pld, ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1475	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1476	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1477	BLOCK_COMMENT("Remaining bytes:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1478	// still 0..bytes_per_loop-1 aligned bytes to copy, count already decreased by (at least) bytes_per_loop bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1479
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1480	// __ add(count, count, ...); // addition useless for the bit tests
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1481	assert (pld_offset % bytes_per_loop == 0, "decreasing count by pld_offset before loop must not change tested bits");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1482
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1483	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1484	assert (bytes_per_loop == 64, "adjust the code below");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1485	assert (bytes_per_count <= 8, "adjust the code below");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1486
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1487	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1488	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1489	__ tbz(count, exact_log2(32/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1490
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1491	bulk_load_backward(end_from, data_regs, 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1492	bulk_store_backward(end_to, data_regs, 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1493
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1494	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1495	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1496
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1497	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1498	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1499	__ tbz(count, exact_log2(16/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1500
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1501	bulk_load_backward(end_from, data_regs, 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1502	bulk_store_backward(end_to, data_regs, 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1503
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1504	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1505	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1506
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1507	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1508	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1509	__ tbz(count, exact_log2(8/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1510
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1511	__ ldr(R3, Address(end_from, -8, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1512	__ str(R3, Address(end_to, -8, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1513
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1514	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1515	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1516
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1517	if (bytes_per_count <= 4) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1518	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1519	__ tbz(count, exact_log2(4/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1520
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1521	__ ldr_w(R3, Address(end_from, -4, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1522	__ str_w(R3, Address(end_to, -4, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1523
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1524	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1525	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1526
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1527	if (bytes_per_count <= 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1528	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1529	__ tbz(count, exact_log2(2/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1530
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1531	__ ldrh(R3, Address(end_from, -2, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1532	__ strh(R3, Address(end_to, -2, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1533
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1534	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1535	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1536
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1537	if (bytes_per_count <= 1) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1538	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1539	__ tbz(count, 0, L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1540
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1541	__ ldrb(R3, Address(end_from, -1, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1542	__ strb(R3, Address(end_to, -1, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1543
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1544	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1545	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1546	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1547	__ tst(count, 16 / bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1548	__ ldmdb(end_from, RegisterSet(R3, R6), writeback, ne); // copy 16 bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1549	__ stmdb(end_to, RegisterSet(R3, R6), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1550
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1551	__ tst(count, 8 / bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1552	__ ldmdb(end_from, RegisterSet(R3, R4), writeback, ne); // copy 8 bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1553	__ stmdb(end_to, RegisterSet(R3, R4), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1554
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1555	if (bytes_per_count <= 4) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1556	__ tst(count, 4 / bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1557	__ ldr(R3, Address(end_from, -4, pre_indexed), ne); // copy 4 bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1558	__ str(R3, Address(end_to, -4, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1559	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1560
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1561	if (bytes_per_count <= 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1562	__ tst(count, 2 / bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1563	__ ldrh(R3, Address(end_from, -2, pre_indexed), ne); // copy 2 bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1564	__ strh(R3, Address(end_to, -2, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1565	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1566
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1567	if (bytes_per_count == 1) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1568	__ tst(count, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1569	__ ldrb(R3, Address(end_from, -1, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1570	__ strb(R3, Address(end_to, -1, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1571	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1572
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1573	__ pop(RegisterSet(R4,R10));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1574	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1575
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1576	return count_per_loop;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1577	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1578
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1579
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1580	// Generate the inner loop for shifted forward array copy (unaligned copy).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1581	// It can be used when bytes_per_count < wordSize, i.e.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1582	// byte/short copy on 32-bit ARM, byte/short/int/compressed-oop copy on AArch64.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1583	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1584	// Arguments
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1585	// from: start src address, 64 bits aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1586	// to: start dst address, (now) wordSize aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1587	// count: number of elements (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1588	// bytes_per_count: number of bytes for each unit of 'count'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1589	// lsr_shift: shift applied to 'old' value to skipped already written bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1590	// lsl_shift: shift applied to 'new' value to set the high bytes of the next write
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1591	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1592	// Return the minimum initial value for count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1593	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1594	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1595	// - 'from' aligned on 64-bit (recommended for 32-bit ARM in case this speeds up LDMIA, required for AArch64)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1596	// - 'to' aligned on wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1597	// - 'count' must be greater or equal than the returned value
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1598	// - 'lsr_shift' + 'lsl_shift' = BitsPerWord
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1599	// - 'bytes_per_count' is 1 or 2 on 32-bit ARM; 1, 2 or 4 on AArch64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1600	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1601	// Increases 'to' by count*bytes_per_count.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1602	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1603	// Scratches 'from' and 'count', R3-R10, R12
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1604	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1605	// On entry:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1606	// - R12 is preloaded with the first 'BitsPerWord' bits read just before 'from'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1607	// - (R12 >> lsr_shift) is the part not yet written (just before 'to')
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1608	// --> (to) = (R12 >> lsr_shift) \| (from) << lsl_shift); ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1609	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1610	// This implementation may read more bytes than required.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1611	// Actually, it always reads exactly all data from the copied region with upper bound aligned up by wordSize,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1612	// so excessive read do not cross a word bound and is thus harmless.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1613	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1614	int generate_forward_shifted_copy_loop(Register from, Register to, Register count, int bytes_per_count, int lsr_shift, int lsl_shift) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1615	assert (from == R0 && to == R1 && count == R2, "adjust the implementation below");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1616
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1617	const int bytes_per_loop = 8*wordSize; // 8 registers are read and written on every loop iter
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1618	const int count_per_loop = bytes_per_loop / bytes_per_count;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1619
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1620	arraycopy_loop_config *config=&arraycopy_configurations[ArmCopyPlatform].forward_shifted;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1621	int pld_offset = config->pld_distance;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1622
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1623	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1624	bool split_read= config->split_ldm;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1625	bool split_write= config->split_stm;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1626	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1627
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1628	const bool prefetch_before = pld_offset < 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1629	const bool prefetch_after = pld_offset > 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1630	Label L_skip_pld, L_last_read, L_done;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1631	if (pld_offset != 0) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1632
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1633	pld_offset = (pld_offset < 0) ? -pld_offset : pld_offset;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1634
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1635	prefetch(from, to, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1636
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1637	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1638	__ cmp_32(count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1639	__ b(L_last_read, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1640	// skip prefetch for small copies
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1641	// warning: count is predecreased by the prefetch distance to optimize the inner loop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1642	__ subs_32(count, count, ((bytes_per_loop + pld_offset) / bytes_per_count) + count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1643	__ b(L_skip_pld, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1644	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1645
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1646	int offset = ArmCopyCacheLineSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1647	while (offset <= pld_offset) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1648	prefetch(from, to, offset);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1649	offset += ArmCopyCacheLineSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1650	};
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1651	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1652
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1653	Label L_shifted_loop;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1654
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1655	__ align(OptoLoopAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1656	__ BIND(L_shifted_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1657
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1658	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1659	// do it early if there might be register locking issues
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1660	prefetch(from, to, bytes_per_loop + pld_offset);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1661	__ BIND(L_skip_pld);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1662	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1663	__ cmp_32(count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1664	__ b(L_last_read, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1665	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1666
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1667	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1668	const Register data_regs[9] = {R3, R4, R5, R6, R7, R8, R9, R10, R12};
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1669	__ logical_shift_right(R3, R12, lsr_shift); // part of R12 not yet written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1670	__ subs_32(count, count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1671	bulk_load_forward(from, &data_regs[1], 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1672	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1673	// read 32 bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1674	if (split_read) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1675	// if write is not split, use less registers in first set to reduce locking
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1676	RegisterSet set1 = split_write ? RegisterSet(R4, R7) : RegisterSet(R4, R5);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1677	RegisterSet set2 = (split_write ? RegisterSet(R8, R10) : RegisterSet(R6, R10)) \| R12;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1678	__ ldmia(from, set1, writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1679	__ mov(R3, AsmOperand(R12, lsr, lsr_shift)); // part of R12 not yet written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1680	__ ldmia(from, set2, writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1681	__ subs(count, count, count_per_loop); // XXX: should it be before the 2nd LDM ? (latency vs locking)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1682	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1683	__ mov(R3, AsmOperand(R12, lsr, lsr_shift)); // part of R12 not yet written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1684	__ ldmia(from, RegisterSet(R4, R10) \| R12, writeback); // Note: small latency on R4
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1685	__ subs(count, count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1686	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1687	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1688
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1689	if (prefetch_after) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1690	// do it after the 1st ldm/ldp anyway (no locking issues with early STM/STP)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1691	prefetch(from, to, pld_offset, bytes_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1692	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1693
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1694	// prepare (shift) the values in R3..R10
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1695	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift)); // merged below low bytes of next val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1696	__ logical_shift_right(R4, R4, lsr_shift); // unused part of next val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1697	__ orr(R4, R4, AsmOperand(R5, lsl, lsl_shift)); // ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1698	__ logical_shift_right(R5, R5, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1699	__ orr(R5, R5, AsmOperand(R6, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1700	__ logical_shift_right(R6, R6, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1701	__ orr(R6, R6, AsmOperand(R7, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1702	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1703	if (split_write) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1704	// write the first half as soon as possible to reduce stm locking
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1705	__ stmia(to, RegisterSet(R3, R6), writeback, prefetch_before ? gt : ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1706	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1707	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1708	__ logical_shift_right(R7, R7, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1709	__ orr(R7, R7, AsmOperand(R8, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1710	__ logical_shift_right(R8, R8, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1711	__ orr(R8, R8, AsmOperand(R9, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1712	__ logical_shift_right(R9, R9, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1713	__ orr(R9, R9, AsmOperand(R10, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1714	__ logical_shift_right(R10, R10, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1715	__ orr(R10, R10, AsmOperand(R12, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1716
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1717	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1718	bulk_store_forward(to, data_regs, 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1719	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1720	if (split_write) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1721	__ stmia(to, RegisterSet(R7, R10), writeback, prefetch_before ? gt : ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1722	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1723	__ stmia(to, RegisterSet(R3, R10), writeback, prefetch_before ? gt : ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1724	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1725	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1726	__ b(L_shifted_loop, gt); // no need to loop if 0 (when count need not be precise modulo bytes_per_loop)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1727
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1728	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1729	// the first loop may end earlier, allowing to skip pld at the end
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1730	__ cmn_32(count, (bytes_per_loop + pld_offset)/bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1731	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1732	__ stmia(to, RegisterSet(R3, R10), writeback); // stmia was skipped
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1733	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1734	__ b(L_skip_pld, ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1735	__ adds_32(count, count, ((bytes_per_loop + pld_offset) / bytes_per_count) + count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1736	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1737
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1738	__ BIND(L_last_read);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1739	__ b(L_done, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1740
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1741	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1742	assert(bytes_per_count < 8, "adjust the code below");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1743
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1744	__ logical_shift_right(R3, R12, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1745
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1746	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1747	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1748	__ tbz(count, exact_log2(32/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1749	bulk_load_forward(from, &data_regs[1], 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1750	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1751	__ logical_shift_right(R4, R4, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1752	__ orr(R4, R4, AsmOperand(R5, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1753	__ logical_shift_right(R5, R5, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1754	__ orr(R5, R5, AsmOperand(R6, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1755	__ logical_shift_right(R6, R6, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1756	__ orr(R6, R6, AsmOperand(R7, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1757	bulk_store_forward(to, data_regs, 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1758	__ logical_shift_right(R3, R7, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1759	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1760	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1761
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1762	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1763	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1764	__ tbz(count, exact_log2(16/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1765	bulk_load_forward(from, &data_regs[1], 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1766	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1767	__ logical_shift_right(R4, R4, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1768	__ orr(R4, R4, AsmOperand(R5, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1769	bulk_store_forward(to, data_regs, 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1770	__ logical_shift_right(R3, R5, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1771	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1772	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1773
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1774	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1775	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1776	__ tbz(count, exact_log2(8/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1777	__ ldr(R4, Address(from, 8, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1778	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1779	__ str(R3, Address(to, 8, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1780	__ logical_shift_right(R3, R4, lsr_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1781	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1782	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1783
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1784	const int have_bytes = lsl_shift/BitsPerByte; // number of already read bytes in R3
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1785
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1786	// It remains less than wordSize to write.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1787	// Do not check count if R3 already has maximal number of loaded elements (one less than wordSize).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1788	if (have_bytes < wordSize - bytes_per_count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1789	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1790	__ andr(count, count, (uintx)(8/bytes_per_count-1)); // make count exact
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1791	__ cmp_32(count, have_bytes/bytes_per_count); // do we have enough bytes to store?
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1792	__ b(L, le);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1793	__ ldr(R4, Address(from, 8, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1794	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1795	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1796	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1797
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1798	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1799	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1800	__ tbz(count, exact_log2(4/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1801	__ str_w(R3, Address(to, 4, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1802	if (bytes_per_count < 4) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1803	__ logical_shift_right(R3, R3, 4*BitsPerByte);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1804	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1805	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1806	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1807
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1808	if (bytes_per_count <= 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1809	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1810	__ tbz(count, exact_log2(2/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1811	__ strh(R3, Address(to, 2, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1812	if (bytes_per_count < 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1813	__ logical_shift_right(R3, R3, 2*BitsPerByte);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1814	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1815	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1816	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1817
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1818	if (bytes_per_count <= 1) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1819	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1820	__ tbz(count, exact_log2(1/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1821	__ strb(R3, Address(to, 1, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1822	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1823	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1824	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1825	switch (bytes_per_count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1826	case 2:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1827	__ mov(R3, AsmOperand(R12, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1828	__ tst(count, 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1829	__ ldmia(from, RegisterSet(R4, R7), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1830	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift), ne); // merged below low bytes of next val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1831	__ mov(R4, AsmOperand(R4, lsr, lsr_shift), ne); // unused part of next val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1832	__ orr(R4, R4, AsmOperand(R5, lsl, lsl_shift), ne); // ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1833	__ mov(R5, AsmOperand(R5, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1834	__ orr(R5, R5, AsmOperand(R6, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1835	__ mov(R6, AsmOperand(R6, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1836	__ orr(R6, R6, AsmOperand(R7, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1837	__ stmia(to, RegisterSet(R3, R6), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1838	__ mov(R3, AsmOperand(R7, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1839
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1840	__ tst(count, 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1841	__ ldmia(from, RegisterSet(R4, R5), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1842	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift), ne); // merged below low bytes of next val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1843	__ mov(R4, AsmOperand(R4, lsr, lsr_shift), ne); // unused part of next val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1844	__ orr(R4, R4, AsmOperand(R5, lsl, lsl_shift), ne); // ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1845	__ stmia(to, RegisterSet(R3, R4), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1846	__ mov(R3, AsmOperand(R5, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1847
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1848	__ tst(count, 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1849	__ ldr(R4, Address(from, 4, post_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1850	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1851	__ str(R3, Address(to, 4, post_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1852	__ mov(R3, AsmOperand(R4, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1853
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1854	__ tst(count, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1855	__ strh(R3, Address(to, 2, post_indexed), ne); // one last short
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1856	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1857
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1858	case 1:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1859	__ mov(R3, AsmOperand(R12, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1860	__ tst(count, 16);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1861	__ ldmia(from, RegisterSet(R4, R7), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1862	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift), ne); // merged below low bytes of next val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1863	__ mov(R4, AsmOperand(R4, lsr, lsr_shift), ne); // unused part of next val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1864	__ orr(R4, R4, AsmOperand(R5, lsl, lsl_shift), ne); // ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1865	__ mov(R5, AsmOperand(R5, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1866	__ orr(R5, R5, AsmOperand(R6, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1867	__ mov(R6, AsmOperand(R6, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1868	__ orr(R6, R6, AsmOperand(R7, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1869	__ stmia(to, RegisterSet(R3, R6), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1870	__ mov(R3, AsmOperand(R7, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1871
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1872	__ tst(count, 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1873	__ ldmia(from, RegisterSet(R4, R5), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1874	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift), ne); // merged below low bytes of next val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1875	__ mov(R4, AsmOperand(R4, lsr, lsr_shift), ne); // unused part of next val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1876	__ orr(R4, R4, AsmOperand(R5, lsl, lsl_shift), ne); // ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1877	__ stmia(to, RegisterSet(R3, R4), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1878	__ mov(R3, AsmOperand(R5, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1879
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1880	__ tst(count, 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1881	__ ldr(R4, Address(from, 4, post_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1882	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1883	__ str(R3, Address(to, 4, post_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1884	__ mov(R3, AsmOperand(R4, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1885
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1886	__ andr(count, count, 3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1887	__ cmp(count, 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1888
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1889	// Note: R3 might contain enough bytes ready to write (3 needed at most),
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1890	// thus load on lsl_shift==24 is not needed (in fact forces reading
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1891	// beyond source buffer end boundary)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1892	if (lsl_shift == 8) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1893	__ ldr(R4, Address(from, 4, post_indexed), ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1894	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift), ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1895	} else if (lsl_shift == 16) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1896	__ ldr(R4, Address(from, 4, post_indexed), gt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1897	__ orr(R3, R3, AsmOperand(R4, lsl, lsl_shift), gt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1898	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1899
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1900	__ strh(R3, Address(to, 2, post_indexed), ge); // two last bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1901	__ mov(R3, AsmOperand(R3, lsr, 16), gt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1902
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1903	__ tst(count, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1904	__ strb(R3, Address(to, 1, post_indexed), ne); // one last byte
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1905	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1906	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1907	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1908
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1909	__ BIND(L_done);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1910	return 0; // no minimum
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1911	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1912
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1913	// Generate the inner loop for shifted backward array copy (unaligned copy).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1914	// It can be used when bytes_per_count < wordSize, i.e.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1915	// byte/short copy on 32-bit ARM, byte/short/int/compressed-oop copy on AArch64.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1916	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1917	// Arguments
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1918	// end_from: end src address, 64 bits aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1919	// end_to: end dst address, (now) wordSize aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1920	// count: number of elements (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1921	// bytes_per_count: number of bytes for each unit of 'count'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1922	// lsl_shift: shift applied to 'old' value to skipped already written bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1923	// lsr_shift: shift applied to 'new' value to set the low bytes of the next write
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1924	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1925	// Return the minimum initial value for count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1926	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1927	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1928	// - 'end_from' aligned on 64-bit (recommended for 32-bit ARM in case this speeds up LDMIA, required for AArch64)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1929	// - 'end_to' aligned on wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1930	// - 'count' must be greater or equal than the returned value
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1931	// - 'lsr_shift' + 'lsl_shift' = 'BitsPerWord'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1932	// - 'bytes_per_count' is 1 or 2 on 32-bit ARM; 1, 2 or 4 on AArch64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1933	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1934	// Decreases 'end_to' by count*bytes_per_count.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1935	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1936	// Scratches 'end_from', 'count', R3-R10, R12
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1937	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1938	// On entry:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1939	// - R3 is preloaded with the first 'BitsPerWord' bits read just after 'from'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1940	// - (R3 << lsl_shift) is the part not yet written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1941	// --> (--to) = (R3 << lsl_shift) \| (--from) >> lsr_shift); ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1942	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1943	// This implementation may read more bytes than required.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1944	// Actually, it always reads exactly all data from the copied region with beginning aligned down by wordSize,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1945	// so excessive read do not cross a word bound and is thus harmless.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1946	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1947	int generate_backward_shifted_copy_loop(Register end_from, Register end_to, Register count, int bytes_per_count, int lsr_shift, int lsl_shift) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1948	assert (end_from == R0 && end_to == R1 && count == R2, "adjust the implementation below");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1949
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1950	const int bytes_per_loop = 8*wordSize; // 8 registers are read and written on every loop iter
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1951	const int count_per_loop = bytes_per_loop / bytes_per_count;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1952
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1953	arraycopy_loop_config *config=&arraycopy_configurations[ArmCopyPlatform].backward_shifted;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1954	int pld_offset = config->pld_distance;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1955
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1956	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1957	bool split_read= config->split_ldm;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1958	bool split_write= config->split_stm;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1959	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1960
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1961
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1962	const bool prefetch_before = pld_offset < 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1963	const bool prefetch_after = pld_offset > 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1964
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1965	Label L_skip_pld, L_done, L_last_read;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1966	if (pld_offset != 0) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1967
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1968	pld_offset = (pld_offset < 0) ? -pld_offset : pld_offset;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1969
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1970	prefetch(end_from, end_to, -wordSize);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1971
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1972	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1973	__ cmp_32(count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1974	__ b(L_last_read, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1975
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1976	// skip prefetch for small copies
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1977	// warning: count is predecreased by the prefetch distance to optimize the inner loop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1978	__ subs_32(count, count, ((bytes_per_loop + pld_offset)/bytes_per_count) + count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1979	__ b(L_skip_pld, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1980	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1981
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1982	int offset = ArmCopyCacheLineSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1983	while (offset <= pld_offset) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1984	prefetch(end_from, end_to, -(wordSize + offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1985	offset += ArmCopyCacheLineSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1986	};
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1987	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1988
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1989	Label L_shifted_loop;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1990	__ align(OptoLoopAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1991	__ BIND(L_shifted_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1992
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1993	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1994	// do the 1st ldm/ldp first anyway (no locking issues with early STM/STP)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1995	prefetch(end_from, end_to, -(wordSize + bytes_per_loop + pld_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1996	__ BIND(L_skip_pld);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1997	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1998	__ cmp_32(count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	1999	__ b(L_last_read, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2000	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2001
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2002	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2003	__ logical_shift_left(R12, R3, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2004	const Register data_regs[9] = {R3, R4, R5, R6, R7, R8, R9, R10, R12};
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2005	bulk_load_backward(end_from, data_regs, 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2006	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2007	if (split_read) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2008	__ ldmdb(end_from, RegisterSet(R7, R10), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2009	__ mov(R12, AsmOperand(R3, lsl, lsl_shift)); // part of R3 not yet written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2010	__ ldmdb(end_from, RegisterSet(R3, R6), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2011	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2012	__ mov(R12, AsmOperand(R3, lsl, lsl_shift)); // part of R3 not yet written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2013	__ ldmdb(end_from, RegisterSet(R3, R10), writeback);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2014	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2015	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2016
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2017	__ subs_32(count, count, count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2018
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2019	if (prefetch_after) { // do prefetch during ldm/ldp latency
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2020	prefetch(end_from, end_to, -(wordSize + pld_offset), -bytes_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2021	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2022
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2023	// prepare the values in R4..R10,R12
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2024	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift)); // merged above high bytes of prev val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2025	__ logical_shift_left(R10, R10, lsl_shift); // unused part of prev val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2026	__ orr(R10, R10, AsmOperand(R9, lsr, lsr_shift)); // ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2027	__ logical_shift_left(R9, R9, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2028	__ orr(R9, R9, AsmOperand(R8, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2029	__ logical_shift_left(R8, R8, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2030	__ orr(R8, R8, AsmOperand(R7, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2031	__ logical_shift_left(R7, R7, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2032	__ orr(R7, R7, AsmOperand(R6, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2033	__ logical_shift_left(R6, R6, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2034	__ orr(R6, R6, AsmOperand(R5, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2035	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2036	if (split_write) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2037	// store early to reduce locking issues
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2038	__ stmdb(end_to, RegisterSet(R6, R10) \| R12, writeback, prefetch_before ? gt : ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2039	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2040	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2041	__ logical_shift_left(R5, R5, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2042	__ orr(R5, R5, AsmOperand(R4, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2043	__ logical_shift_left(R4, R4, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2044	__ orr(R4, R4, AsmOperand(R3, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2045
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2046	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2047	bulk_store_backward(end_to, &data_regs[1], 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2048	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2049	if (split_write) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2050	__ stmdb(end_to, RegisterSet(R4, R5), writeback, prefetch_before ? gt : ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2051	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2052	__ stmdb(end_to, RegisterSet(R4, R10) \| R12, writeback, prefetch_before ? gt : ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2053	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2054	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2055
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2056	__ b(L_shifted_loop, gt); // no need to loop if 0 (when count need not be precise modulo bytes_per_loop)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2057
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2058	if (prefetch_before) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2059	// the first loop may end earlier, allowing to skip pld at the end
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2060	__ cmn_32(count, ((bytes_per_loop + pld_offset)/bytes_per_count));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2061	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2062	__ stmdb(end_to, RegisterSet(R4, R10) \| R12, writeback); // stmdb was skipped
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2063	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2064	__ b(L_skip_pld, ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2065	__ adds_32(count, count, ((bytes_per_loop + pld_offset) / bytes_per_count) + count_per_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2066	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2067
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2068	__ BIND(L_last_read);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2069	__ b(L_done, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2070
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2071	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2072	assert(bytes_per_count < 8, "adjust the code below");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2073
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2074	__ logical_shift_left(R12, R3, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2075
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2076	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2077	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2078	__ tbz(count, exact_log2(32/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2079	bulk_load_backward(end_from, &data_regs[4], 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2080
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2081	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2082	__ logical_shift_left(R10, R10, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2083	__ orr(R10, R10, AsmOperand(R9, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2084	__ logical_shift_left(R9, R9, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2085	__ orr(R9, R9, AsmOperand(R8, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2086	__ logical_shift_left(R8, R8, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2087	__ orr(R8, R8, AsmOperand(R7, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2088
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2089	bulk_store_backward(end_to, &data_regs[5], 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2090	__ logical_shift_left(R12, R7, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2091	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2092	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2093
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2094	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2095	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2096	__ tbz(count, exact_log2(16/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2097	bulk_load_backward(end_from, &data_regs[6], 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2098
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2099	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2100	__ logical_shift_left(R10, R10, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2101	__ orr(R10, R10, AsmOperand(R9, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2102
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2103	bulk_store_backward(end_to, &data_regs[7], 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2104	__ logical_shift_left(R12, R9, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2105	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2106	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2107
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2108	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2109	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2110	__ tbz(count, exact_log2(8/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2111	__ ldr(R10, Address(end_from, -8, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2112	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2113	__ str(R12, Address(end_to, -8, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2114	__ logical_shift_left(R12, R10, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2115	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2116	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2117
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2118	const int have_bytes = lsr_shift/BitsPerByte; // number of already read bytes in R12
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2119
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2120	// It remains less than wordSize to write.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2121	// Do not check count if R12 already has maximal number of loaded elements (one less than wordSize).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2122	if (have_bytes < wordSize - bytes_per_count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2123	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2124	__ andr(count, count, (uintx)(8/bytes_per_count-1)); // make count exact
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2125	__ cmp_32(count, have_bytes/bytes_per_count); // do we have enough bytes to store?
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2126	__ b(L, le);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2127	__ ldr(R10, Address(end_from, -8, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2128	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2129	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2130	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2131
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2132	assert (bytes_per_count <= 4, "must be");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2133
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2134	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2135	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2136	__ tbz(count, exact_log2(4/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2137	__ logical_shift_right(R9, R12, (wordSize-4)*BitsPerByte);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2138	__ str_w(R9, Address(end_to, -4, pre_indexed)); // Write 4 MSB
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2139	if (bytes_per_count < 4) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2140	__ logical_shift_left(R12, R12, 4*BitsPerByte); // Promote remaining bytes to MSB
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2141	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2142	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2143	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2144
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2145	if (bytes_per_count <= 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2146	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2147	__ tbz(count, exact_log2(2/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2148	__ logical_shift_right(R9, R12, (wordSize-2)*BitsPerByte);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2149	__ strh(R9, Address(end_to, -2, pre_indexed)); // Write 2 MSB
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2150	if (bytes_per_count < 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2151	__ logical_shift_left(R12, R12, 2*BitsPerByte); // Promote remaining bytes to MSB
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2152	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2153	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2154	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2155
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2156	if (bytes_per_count <= 1) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2157	Label L;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2158	__ tbz(count, exact_log2(1/bytes_per_count), L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2159	__ logical_shift_right(R9, R12, (wordSize-1)*BitsPerByte);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2160	__ strb(R9, Address(end_to, -1, pre_indexed)); // Write 1 MSB
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2161	__ bind(L);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2162	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2163	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2164	switch(bytes_per_count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2165	case 2:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2166	__ mov(R12, AsmOperand(R3, lsl, lsl_shift)); // part of R3 not yet written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2167	__ tst(count, 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2168	__ ldmdb(end_from, RegisterSet(R7,R10), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2169	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2170	__ mov(R10, AsmOperand(R10, lsl, lsl_shift),ne); // unused part of prev val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2171	__ orr(R10, R10, AsmOperand(R9, lsr, lsr_shift),ne); // ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2172	__ mov(R9, AsmOperand(R9, lsl, lsl_shift),ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2173	__ orr(R9, R9, AsmOperand(R8, lsr, lsr_shift),ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2174	__ mov(R8, AsmOperand(R8, lsl, lsl_shift),ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2175	__ orr(R8, R8, AsmOperand(R7, lsr, lsr_shift),ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2176	__ stmdb(end_to, RegisterSet(R8,R10)\|R12, writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2177	__ mov(R12, AsmOperand(R7, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2178
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2179	__ tst(count, 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2180	__ ldmdb(end_from, RegisterSet(R9, R10), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2181	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2182	__ mov(R10, AsmOperand(R10, lsl, lsl_shift),ne); // unused part of prev val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2183	__ orr(R10, R10, AsmOperand(R9, lsr,lsr_shift),ne); // ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2184	__ stmdb(end_to, RegisterSet(R10)\|R12, writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2185	__ mov(R12, AsmOperand(R9, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2186
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2187	__ tst(count, 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2188	__ ldr(R10, Address(end_from, -4, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2189	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2190	__ str(R12, Address(end_to, -4, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2191	__ mov(R12, AsmOperand(R10, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2192
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2193	__ tst(count, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2194	__ mov(R12, AsmOperand(R12, lsr, lsr_shift),ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2195	__ strh(R12, Address(end_to, -2, pre_indexed), ne); // one last short
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2196	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2197
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2198	case 1:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2199	__ mov(R12, AsmOperand(R3, lsl, lsl_shift)); // part of R3 not yet written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2200	__ tst(count, 16);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2201	__ ldmdb(end_from, RegisterSet(R7,R10), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2202	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2203	__ mov(R10, AsmOperand(R10, lsl, lsl_shift),ne); // unused part of prev val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2204	__ orr(R10, R10, AsmOperand(R9, lsr, lsr_shift),ne); // ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2205	__ mov(R9, AsmOperand(R9, lsl, lsl_shift),ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2206	__ orr(R9, R9, AsmOperand(R8, lsr, lsr_shift),ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2207	__ mov(R8, AsmOperand(R8, lsl, lsl_shift),ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2208	__ orr(R8, R8, AsmOperand(R7, lsr, lsr_shift),ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2209	__ stmdb(end_to, RegisterSet(R8,R10)\|R12, writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2210	__ mov(R12, AsmOperand(R7, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2211
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2212	__ tst(count, 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2213	__ ldmdb(end_from, RegisterSet(R9,R10), writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2214	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2215	__ mov(R10, AsmOperand(R10, lsl, lsl_shift),ne); // unused part of prev val
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2216	__ orr(R10, R10, AsmOperand(R9, lsr, lsr_shift),ne); // ...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2217	__ stmdb(end_to, RegisterSet(R10)\|R12, writeback, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2218	__ mov(R12, AsmOperand(R9, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2219
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2220	__ tst(count, 4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2221	__ ldr(R10, Address(end_from, -4, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2222	__ orr(R12, R12, AsmOperand(R10, lsr, lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2223	__ str(R12, Address(end_to, -4, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2224	__ mov(R12, AsmOperand(R10, lsl, lsl_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2225
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2226	__ tst(count, 2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2227	if (lsr_shift != 24) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2228	// avoid useless reading R10 when we already have 3 bytes ready in R12
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2229	__ ldr(R10, Address(end_from, -4, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2230	__ orr(R12, R12, AsmOperand(R10, lsr,lsr_shift), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2231	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2232
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2233	// Note: R12 contains enough bytes ready to write (3 needed at most)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2234	// write the 2 MSBs
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2235	__ mov(R9, AsmOperand(R12, lsr, 16), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2236	__ strh(R9, Address(end_to, -2, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2237	// promote remaining to MSB
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2238	__ mov(R12, AsmOperand(R12, lsl, 16), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2239
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2240	__ tst(count, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2241	// write the MSB of R12
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2242	__ mov(R12, AsmOperand(R12, lsr, 24), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2243	__ strb(R12, Address(end_to, -1, pre_indexed), ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2244
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2245	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2246	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2247	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2248
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2249	__ BIND(L_done);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2250	return 0; // no minimum
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2251	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2252
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2253	// This method is very useful for merging forward/backward implementations
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2254	Address get_addr_with_indexing(Register base, int delta, bool forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2255	if (forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2256	return Address(base, delta, post_indexed);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2257	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2258	return Address(base, -delta, pre_indexed);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2259	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2260	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2261
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2262	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2263	// Loads one 'size_in_bytes'-sized value from 'from' in given direction, i.e.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2264	// if forward: loads value at from and increases from by size
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2265	// if !forward: loads value at from-size_in_bytes and decreases from by size
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2266	void load_one(Register rd, Register from, int size_in_bytes, bool forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2267	assert_different_registers(from, rd);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2268	Address addr = get_addr_with_indexing(from, size_in_bytes, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2269	__ load_sized_value(rd, addr, size_in_bytes, false);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2270	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2271
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2272	// Stores one 'size_in_bytes'-sized value to 'to' in given direction (see load_one)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2273	void store_one(Register rd, Register to, int size_in_bytes, bool forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2274	assert_different_registers(to, rd);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2275	Address addr = get_addr_with_indexing(to, size_in_bytes, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2276	__ store_sized_value(rd, addr, size_in_bytes);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2277	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2278	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2279	// load_one and store_one are the same as for AArch64 except for
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2280	// *) Support for condition execution
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2281	// *) Second value register argument for 8-byte values
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2282
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2283	void load_one(Register rd, Register from, int size_in_bytes, bool forward, AsmCondition cond = al, Register rd2 = noreg) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2284	assert_different_registers(from, rd, rd2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2285	if (size_in_bytes < 8) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2286	Address addr = get_addr_with_indexing(from, size_in_bytes, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2287	__ load_sized_value(rd, addr, size_in_bytes, false, cond);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2288	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2289	assert (rd2 != noreg, "second value register must be specified");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2290	assert (rd->encoding() < rd2->encoding(), "wrong value register set");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2291
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2292	if (forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2293	__ ldmia(from, RegisterSet(rd) \| rd2, writeback, cond);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2294	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2295	__ ldmdb(from, RegisterSet(rd) \| rd2, writeback, cond);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2296	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2297	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2298	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2299
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2300	void store_one(Register rd, Register to, int size_in_bytes, bool forward, AsmCondition cond = al, Register rd2 = noreg) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2301	assert_different_registers(to, rd, rd2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2302	if (size_in_bytes < 8) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2303	Address addr = get_addr_with_indexing(to, size_in_bytes, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2304	__ store_sized_value(rd, addr, size_in_bytes, cond);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2305	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2306	assert (rd2 != noreg, "second value register must be specified");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2307	assert (rd->encoding() < rd2->encoding(), "wrong value register set");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2308
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2309	if (forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2310	__ stmia(to, RegisterSet(rd) \| rd2, writeback, cond);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2311	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2312	__ stmdb(to, RegisterSet(rd) \| rd2, writeback, cond);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2313	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2314	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2315	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2316	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2317
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2318	// Copies data from 'from' to 'to' in specified direction to align 'from' by 64 bits.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2319	// (on 32-bit ARM 64-bit alignment is better for LDM).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2320	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2321	// Arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2322	// from: beginning (if forward) or upper bound (if !forward) of the region to be read
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2323	// to: beginning (if forward) or upper bound (if !forward) of the region to be written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2324	// count: 32-bit int, maximum number of elements which can be copied
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2325	// bytes_per_count: size of an element
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2326	// forward: specifies copy direction
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2327	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2328	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2329	// 'from' and 'to' must be aligned by 'bytes_per_count'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2330	// 'count' must not be less than the returned value
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2331	// shifts 'from' and 'to' by the number of copied bytes in corresponding direction
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2332	// decreases 'count' by the number of elements copied
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2333	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2334	// Returns maximum number of bytes which may be copied.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2335	int align_src(Register from, Register to, Register count, Register tmp, int bytes_per_count, bool forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2336	assert_different_registers(from, to, count, tmp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2337	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2338	// TODO-AARCH64: replace by simple loop?
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2339	Label Laligned_by_2, Laligned_by_4, Laligned_by_8;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2340
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2341	if (bytes_per_count == 1) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2342	__ tbz(from, 0, Laligned_by_2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2343	__ sub_32(count, count, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2344	load_one(tmp, from, 1, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2345	store_one(tmp, to, 1, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2346	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2347
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2348	__ BIND(Laligned_by_2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2349
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2350	if (bytes_per_count <= 2) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2351	__ tbz(from, 1, Laligned_by_4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2352	__ sub_32(count, count, 2/bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2353	load_one(tmp, from, 2, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2354	store_one(tmp, to, 2, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2355	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2356
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2357	__ BIND(Laligned_by_4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2358
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2359	if (bytes_per_count <= 4) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2360	__ tbz(from, 2, Laligned_by_8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2361	__ sub_32(count, count, 4/bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2362	load_one(tmp, from, 4, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2363	store_one(tmp, to, 4, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2364	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2365	__ BIND(Laligned_by_8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2366	#else // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2367	if (bytes_per_count < 8) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2368	Label L_align_src;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2369	__ BIND(L_align_src);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2370	__ tst(from, 7);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2371	// ne => not aligned: copy one element and (if bytes_per_count < 4) loop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2372	__ sub(count, count, 1, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2373	load_one(tmp, from, bytes_per_count, forward, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2374	store_one(tmp, to, bytes_per_count, forward, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2375	if (bytes_per_count < 4) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2376	__ b(L_align_src, ne); // if bytes_per_count == 4, then 0 or 1 loop iterations are enough
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2377	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2378	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2379	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2380	return 7/bytes_per_count;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2381	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2382
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2383	// Copies 'count' of 'bytes_per_count'-sized elements in the specified direction.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2384	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2385	// Arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2386	// from: beginning (if forward) or upper bound (if !forward) of the region to be read
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2387	// to: beginning (if forward) or upper bound (if !forward) of the region to be written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2388	// count: 32-bit int, number of elements to be copied
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2389	// entry: copy loop entry point
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2390	// bytes_per_count: size of an element
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2391	// forward: specifies copy direction
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2392	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2393	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2394	// shifts 'from' and 'to'
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2395	void copy_small_array(Register from, Register to, Register count, Register tmp, Register tmp2, int bytes_per_count, bool forward, Label & entry) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2396	assert_different_registers(from, to, count, tmp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2397
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2398	__ align(OptoLoopAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2399	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2400	Label L_small_array_done, L_small_array_loop;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2401	__ BIND(entry);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2402	__ cbz_32(count, L_small_array_done);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2403
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2404	__ BIND(L_small_array_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2405	__ subs_32(count, count, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2406	load_one(tmp, from, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2407	store_one(tmp, to, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2408	__ b(L_small_array_loop, gt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2409
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2410	__ BIND(L_small_array_done);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2411	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2412	Label L_small_loop;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2413	__ BIND(L_small_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2414	store_one(tmp, to, bytes_per_count, forward, al, tmp2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2415	__ BIND(entry); // entry point
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2416	__ subs(count, count, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2417	load_one(tmp, from, bytes_per_count, forward, ge, tmp2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2418	__ b(L_small_loop, ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2419	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2420	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2421
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2422	// Aligns 'to' by reading one word from 'from' and writting its part to 'to'.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2423	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2424	// Arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2425	// to: beginning (if forward) or upper bound (if !forward) of the region to be written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2426	// count: 32-bit int, number of elements allowed to be copied
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2427	// to_remainder: remainder of dividing 'to' by wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2428	// bytes_per_count: size of an element
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2429	// forward: specifies copy direction
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2430	// Rval: contains an already read but not yet written word;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2431	// its' LSBs (if forward) or MSBs (if !forward) are to be written to align 'to'.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2432	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2433	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2434	// 'count' must not be less then the returned value
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2435	// 'to' must be aligned by bytes_per_count but must not be aligned by wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2436	// shifts 'to' by the number of written bytes (so that it becomes the bound of memory to be written)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2437	// decreases 'count' by the the number of elements written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2438	// Rval's MSBs or LSBs remain to be written further by generate_{forward,backward}_shifted_copy_loop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2439	int align_dst(Register to, Register count, Register Rval, Register tmp,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2440	int to_remainder, int bytes_per_count, bool forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2441	assert_different_registers(to, count, tmp, Rval);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2442
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2443	assert (0 < to_remainder && to_remainder < wordSize, "to_remainder is not valid");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2444	assert (to_remainder % bytes_per_count == 0, "to must be aligned by bytes_per_count");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2445
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2446	int bytes_to_write = forward ? (wordSize - to_remainder) : to_remainder;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2447
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2448	int offset = 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2449
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2450	for (int l = 0; l < LogBytesPerWord; ++l) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2451	int s = (1 << l);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2452	if (bytes_to_write & s) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2453	int new_offset = offset + s*BitsPerByte;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2454	if (forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2455	if (offset == 0) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2456	store_one(Rval, to, s, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2457	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2458	__ logical_shift_right(tmp, Rval, offset);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2459	store_one(tmp, to, s, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2460	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2461	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2462	__ logical_shift_right(tmp, Rval, BitsPerWord - new_offset);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2463	store_one(tmp, to, s, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2464	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2465
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2466	offset = new_offset;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2467	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2468	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2469
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2470	assert (offset == bytes_to_write * BitsPerByte, "all bytes must be copied");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2471
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2472	__ sub_32(count, count, bytes_to_write/bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2473
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2474	return bytes_to_write / bytes_per_count;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2475	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2476
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2477	// Copies 'count' of elements using shifted copy loop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2478	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2479	// Arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2480	// from: beginning (if forward) or upper bound (if !forward) of the region to be read
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2481	// to: beginning (if forward) or upper bound (if !forward) of the region to be written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2482	// count: 32-bit int, number of elements to be copied
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2483	// to_remainder: remainder of dividing 'to' by wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2484	// bytes_per_count: size of an element
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2485	// forward: specifies copy direction
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2486	// Rval: contains an already read but not yet written word
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2487	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2488	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2489	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2490	// 'count' must not be less then the returned value
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2491	// 'from' must be aligned by wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2492	// 'to' must be aligned by bytes_per_count but must not be aligned by wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2493	// shifts 'to' by the number of copied bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2494	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2495	// Scratches R3-R10, R12
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2496	int align_dst_and_generate_shifted_copy_loop(Register from, Register to, Register count, Register Rval,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2497	int to_remainder, int bytes_per_count, bool forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2498
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2499	assert (0 < to_remainder && to_remainder < wordSize, "to_remainder is invalid");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2500
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2501	const Register tmp = forward ? R3 : R12; // TODO-AARCH64: on cojoint_short R4 was used for tmp
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2502	assert_different_registers(from, to, count, Rval, tmp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2503
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2504	int required_to_align = align_dst(to, count, Rval, tmp, to_remainder, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2505
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2506	int lsr_shift = (wordSize - to_remainder) * BitsPerByte;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2507	int lsl_shift = to_remainder * BitsPerByte;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2508
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2509	int min_copy;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2510	if (forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2511	min_copy = generate_forward_shifted_copy_loop(from, to, count, bytes_per_count, lsr_shift, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2512	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2513	min_copy = generate_backward_shifted_copy_loop(from, to, count, bytes_per_count, lsr_shift, lsl_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2514	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2515
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2516	return min_copy + required_to_align;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2517	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2518
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2519	// Copies 'count' of elements using shifted copy loop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2520	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2521	// Arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2522	// from: beginning (if forward) or upper bound (if !forward) of the region to be read
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2523	// to: beginning (if forward) or upper bound (if !forward) of the region to be written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2524	// count: 32-bit int, number of elements to be copied
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2525	// bytes_per_count: size of an element
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2526	// forward: specifies copy direction
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2527	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2528	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2529	// 'count' must not be less then the returned value
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2530	// 'from' must be aligned by wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2531	// 'to' must be aligned by bytes_per_count but must not be aligned by wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2532	// shifts 'to' by the number of copied bytes
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2533	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2534	// Scratches 'from', 'count', R3 and R12.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2535	// On AArch64 also scratches R4-R10, on 32-bit ARM saves them to use.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2536	int align_dst_and_generate_shifted_copy_loop(Register from, Register to, Register count, int bytes_per_count, bool forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2537
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2538	const Register Rval = forward ? R12 : R3; // as generate_{forward,backward}_shifted_copy_loop expect
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2539
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2540	int min_copy = 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2541
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2542	// Note: if {seq} is a sequence of numbers, L{seq} means that if the execution reaches this point,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2543	// then the remainder of 'to' divided by wordSize is one of elements of {seq}.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2544
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2545	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2546	// TODO-AARCH64: simplify, tune
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2547
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2548	load_one(Rval, from, wordSize, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2549
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2550	Label L_loop_finished;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2551
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2552	switch (bytes_per_count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2553	case 4:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2554	min_copy = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 4, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2555	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2556	case 2:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2557	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2558	Label L2, L4, L6;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2559
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2560	__ tbz(to, 1, L4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2561	__ tbz(to, 2, L2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2562
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2563	__ BIND(L6);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2564	int min_copy6 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 6, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2565	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2566
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2567	__ BIND(L2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2568	int min_copy2 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 2, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2569	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2570
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2571	__ BIND(L4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2572	int min_copy4 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 4, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2573
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2574	min_copy = MAX2(MAX2(min_copy2, min_copy4), min_copy6);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2575	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2576	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2577	case 1:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2578	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2579	Label L1, L2, L3, L4, L5, L6, L7;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2580	Label L15, L26;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2581	Label L246;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2582
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2583	__ tbz(to, 0, L246);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2584	__ tbz(to, 1, L15);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2585	__ tbz(to, 2, L3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2586
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2587	__ BIND(L7);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2588	int min_copy7 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 7, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2589	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2590
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2591	__ BIND(L246);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2592	__ tbnz(to, 1, L26);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2593
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2594	__ BIND(L4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2595	int min_copy4 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 4, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2596	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2597
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2598	__ BIND(L15);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2599	__ tbz(to, 2, L1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2600
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2601	__ BIND(L5);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2602	int min_copy5 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 5, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2603	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2604
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2605	__ BIND(L3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2606	int min_copy3 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 3, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2607	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2608
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2609	__ BIND(L26);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2610	__ tbz(to, 2, L2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2611
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2612	__ BIND(L6);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2613	int min_copy6 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 6, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2614	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2615
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2616	__ BIND(L1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2617	int min_copy1 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 1, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2618	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2619
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2620	__ BIND(L2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2621	int min_copy2 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 2, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2622
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2623
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2624	min_copy = MAX2(min_copy1, min_copy2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2625	min_copy = MAX2(min_copy, min_copy3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2626	min_copy = MAX2(min_copy, min_copy4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2627	min_copy = MAX2(min_copy, min_copy5);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2628	min_copy = MAX2(min_copy, min_copy6);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2629	min_copy = MAX2(min_copy, min_copy7);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2630	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2631	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2632	default:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2633	ShouldNotReachHere();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2634	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2635	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2636	__ BIND(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2637
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2638	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2639	__ push(RegisterSet(R4,R10));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2640	load_one(Rval, from, wordSize, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2641
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2642	switch (bytes_per_count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2643	case 2:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2644	min_copy = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 2, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2645	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2646	case 1:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2647	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2648	Label L1, L2, L3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2649	int min_copy1, min_copy2, min_copy3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2650
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2651	Label L_loop_finished;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2652
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2653	if (forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2654	__ tbz(to, 0, L2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2655	__ tbz(to, 1, L1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2656
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2657	__ BIND(L3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2658	min_copy3 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 3, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2659	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2660
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2661	__ BIND(L1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2662	min_copy1 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 1, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2663	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2664
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2665	__ BIND(L2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2666	min_copy2 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 2, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2667	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2668	__ tbz(to, 0, L2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2669	__ tbnz(to, 1, L3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2670
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2671	__ BIND(L1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2672	min_copy1 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 1, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2673	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2674
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2675	__ BIND(L3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2676	min_copy3 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 3, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2677	__ b(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2678
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2679	__ BIND(L2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2680	min_copy2 = align_dst_and_generate_shifted_copy_loop(from, to, count, Rval, 2, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2681	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2682
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2683	min_copy = MAX2(MAX2(min_copy1, min_copy2), min_copy3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2684
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2685	__ BIND(L_loop_finished);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2686
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2687	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2688	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2689	default:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2690	ShouldNotReachHere();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2691	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2692	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2693
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2694	__ pop(RegisterSet(R4,R10));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2695	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2696
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2697	return min_copy;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2698	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2699
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2700	#ifndef PRODUCT
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2701	int * get_arraycopy_counter(int bytes_per_count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2702	switch (bytes_per_count) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2703	case 1:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2704	return &SharedRuntime::_jbyte_array_copy_ctr;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2705	case 2:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2706	return &SharedRuntime::_jshort_array_copy_ctr;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2707	case 4:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2708	return &SharedRuntime::_jint_array_copy_ctr;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2709	case 8:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2710	return &SharedRuntime::_jlong_array_copy_ctr;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2711	default:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2712	ShouldNotReachHere();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2713	return NULL;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2714	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2715	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2716	#endif // !PRODUCT
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2717
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2718	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2719	// Generate stub for primitive array copy. If "aligned" is true, the
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2720	// "from" and "to" addresses are assumed to be heapword aligned.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2721	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2722	// If "disjoint" is true, arrays are assumed to be disjoint, otherwise they may overlap and
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2723	// "nooverlap_target" must be specified as the address to jump if they don't.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2724	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2725	// Arguments for generated stub:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2726	// from: R0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2727	// to: R1
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2728	// count: R2 treated as signed 32-bit int
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2729	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2730	address generate_primitive_copy(bool aligned, const char * name, bool status, int bytes_per_count, bool disjoint, address nooverlap_target = NULL) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2731	__ align(CodeEntryAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2732	StubCodeMark mark(this, "StubRoutines", name);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2733	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2734
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2735	const Register from = R0; // source array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2736	const Register to = R1; // destination array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2737	const Register count = R2; // elements count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2738	const Register tmp1 = R3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2739	const Register tmp2 = R12;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2740
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2741	if (!aligned) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2742	BLOCK_COMMENT("Entry:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2743	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2744
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2745	__ zap_high_non_significant_bits(R2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2746
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2747	if (!disjoint) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2748	assert (nooverlap_target != NULL, "must be specified for conjoint case");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2749	array_overlap_test(nooverlap_target, exact_log2(bytes_per_count), tmp1, tmp2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2750	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2751
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2752	inc_counter_np(*get_arraycopy_counter(bytes_per_count), tmp1, tmp2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2753
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2754	// Conjoint case: since execution reaches this point, the arrays overlap, so performing backward copy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2755	// Disjoint case: perform forward copy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2756	bool forward = disjoint;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2757
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2758
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2759	if (!forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2760	// Set 'from' and 'to' to upper bounds
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2761	int log_bytes_per_count = exact_log2(bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2762	__ add_ptr_scaled_int32(to, to, count, log_bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2763	__ add_ptr_scaled_int32(from, from, count, log_bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2764	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2765
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2766	// There are two main copy loop implementations:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2767	// *) The huge and complex one applicable only for large enough arrays
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2768	// *) The small and simple one applicable for any array (but not efficient for large arrays).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2769	// Currently "small" implementation is used if and only if the "large" one could not be used.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2770	// XXX optim: tune the limit higher ?
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2771	// Large implementation lower applicability bound is actually determined by
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2772	// aligned copy loop which require <=7 bytes for src alignment, and 8 words for aligned copy loop.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2773	const int small_copy_limit = (8*wordSize + 7) / bytes_per_count;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2774
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2775	Label L_small_array;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2776	__ cmp_32(count, small_copy_limit);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2777	__ b(L_small_array, le); // TODO-AARCH64: le vs lt
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2778
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2779	// Otherwise proceed with large implementation.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2780
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2781	bool from_is_aligned = (bytes_per_count >= 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2782	if (aligned && forward && (HeapWordSize % 8 == 0)) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2783	// if 'from' is heapword aligned and HeapWordSize is divisible by 8,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2784	// then from is aligned by 8
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2785	from_is_aligned = true;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2786	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2787
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2788	int count_required_to_align = from_is_aligned ? 0 : align_src(from, to, count, tmp1, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2789	assert (small_copy_limit >= count_required_to_align, "alignment could exhaust count");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2790
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2791	// now 'from' is aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2792
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2793	bool to_is_aligned = false;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2794
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2795	if (bytes_per_count >= wordSize) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2796	// 'to' is aligned by bytes_per_count, so it is aligned by wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2797	to_is_aligned = true;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2798	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2799	if (aligned && (8 % HeapWordSize == 0) && (HeapWordSize % wordSize == 0)) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2800	// Originally 'from' and 'to' were heapword aligned;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2801	// (from - to) has not been changed, so since now 'from' is 8-byte aligned, then it is also heapword aligned,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2802	// so 'to' is also heapword aligned and thus aligned by wordSize.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2803	to_is_aligned = true;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2804	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2805	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2806
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2807	Label L_unaligned_dst;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2808
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2809	if (!to_is_aligned) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2810	BLOCK_COMMENT("Check dst alignment:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2811	__ tst(to, wordSize - 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2812	__ b(L_unaligned_dst, ne); // 'to' is not aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2813	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2814
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2815	// 'from' and 'to' are properly aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2816
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2817	int min_copy;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2818	if (forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2819	min_copy = generate_forward_aligned_copy_loop (from, to, count, bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2820	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2821	min_copy = generate_backward_aligned_copy_loop(from, to, count, bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2822	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2823	assert(small_copy_limit >= count_required_to_align + min_copy, "first loop might exhaust count");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2824
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2825	if (status) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2826	__ mov(R0, 0); // OK
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2827	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2828
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2829	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2830
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2831	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2832	copy_small_array(from, to, count, tmp1, tmp2, bytes_per_count, forward, L_small_array /* entry */);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2833
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2834	if (status) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2835	__ mov(R0, 0); // OK
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2836	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2837
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2838	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2839	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2840
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2841	if (! to_is_aligned) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2842	__ BIND(L_unaligned_dst);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2843	int min_copy_shifted = align_dst_and_generate_shifted_copy_loop(from, to, count, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2844	assert (small_copy_limit >= count_required_to_align + min_copy_shifted, "first loop might exhaust count");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2845
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2846	if (status) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2847	__ mov(R0, 0); // OK
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2848	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2849
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2850	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2851	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2852
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2853	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2854	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2855
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2856	#if INCLUDE_ALL_GCS
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2857	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2858	// Generate pre-write barrier for array.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2859	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2860	// Input:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2861	// addr - register containing starting address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2862	// count - register containing element count, 32-bit int
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2863	// callee_saved_regs -
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2864	// the call must preserve this number of registers: R0, R1, ..., R[callee_saved_regs-1]
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2865	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2866	// callee_saved_regs must include addr and count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2867	// Blows all volatile registers (R0-R3 on 32-bit ARM, R0-R18 on AArch64, Rtemp, LR) except for callee_saved_regs.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2868	void gen_write_ref_array_pre_barrier(Register addr, Register count, int callee_saved_regs) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2869	BarrierSet* bs = Universe::heap()->barrier_set();
47658 c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2870	switch (bs->kind()) {
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2871	case BarrierSet::G1SATBCTLogging:
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2872	{
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2873	assert( addr->encoding() < callee_saved_regs, "addr must be saved");
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2874	assert(count->encoding() < callee_saved_regs, "count must be saved");
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2875
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2876	BLOCK_COMMENT("PreBarrier");
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2877
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2878	#ifdef AARCH64
47658 c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2879	callee_saved_regs = align_up(callee_saved_regs, 2);
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2880	for (int i = 0; i < callee_saved_regs; i += 2) {
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2881	__ raw_push(as_Register(i), as_Register(i+1));
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2882	}
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2883	#else
47658 c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2884	RegisterSet saved_regs = RegisterSet(R0, as_Register(callee_saved_regs-1));
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2885	__ push(saved_regs \| R9ifScratched);
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2886	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2887
47658 c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2888	if (addr != R0) {
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2889	assert_different_registers(count, R0);
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2890	__ mov(R0, addr);
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2891	}
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2892	#ifdef AARCH64
47658 c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2893	__ zero_extend(R1, count, 32); // BarrierSet::static_write_ref_array_pre takes size_t
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2894	#else
47658 c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2895	if (count != R1) {
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2896	__ mov(R1, count);
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2897	}
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2898	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2899
47658 c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2900	__ call(CAST_FROM_FN_PTR(address, BarrierSet::static_write_ref_array_pre));
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2901
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2902	#ifdef AARCH64
47658 c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2903	for (int i = callee_saved_regs - 2; i >= 0; i -= 2) {
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2904	__ raw_pop(as_Register(i), as_Register(i+1));
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2905	}
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2906	#else
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2907	__ pop(saved_regs \| R9ifScratched);
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2908	#endif // AARCH64
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2909	}
47658 c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2910	case BarrierSet::CardTableForRS:
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2911	case BarrierSet::CardTableExtension:
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2912	break;
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2913	default:
c2b7fb8e5144 8189355: Cleanup of BarrierSet barrier functions eosterlund parents: 47216 diff changeset	2914	ShouldNotReachHere();
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2915	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2916	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2917	#endif // INCLUDE_ALL_GCS
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2918
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2919	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2920	// Generate post-write barrier for array.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2921	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2922	// Input:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2923	// addr - register containing starting address (can be scratched)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2924	// count - register containing element count, 32-bit int (can be scratched)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2925	// tmp - scratch register
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2926	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2927	// Note: LR can be scratched but might be equal to addr, count or tmp
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2928	// Blows all volatile registers (R0-R3 on 32-bit ARM, R0-R18 on AArch64, Rtemp, LR).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2929	void gen_write_ref_array_post_barrier(Register addr, Register count, Register tmp) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2930	assert_different_registers(addr, count, tmp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2931	BarrierSet* bs = Universe::heap()->barrier_set();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2932
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2933	switch (bs->kind()) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2934	case BarrierSet::G1SATBCTLogging:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2935	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2936	BLOCK_COMMENT("G1PostBarrier");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2937	if (addr != R0) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2938	assert_different_registers(count, R0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2939	__ mov(R0, addr);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2940	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2941	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2942	__ zero_extend(R1, count, 32); // BarrierSet::static_write_ref_array_post takes size_t
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2943	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2944	if (count != R1) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2945	__ mov(R1, count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2946	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2947	#if R9_IS_SCRATCHED
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2948	// Safer to save R9 here since callers may have been written
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2949	// assuming R9 survives. This is suboptimal but is not in
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2950	// general worth optimizing for the few platforms where R9
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2951	// is scratched. Note that the optimization might not be to
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2952	// difficult for this particular call site.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2953	__ push(R9);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2954	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2955	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2956	__ call(CAST_FROM_FN_PTR(address, BarrierSet::static_write_ref_array_post));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2957	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2958	#if R9_IS_SCRATCHED
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2959	__ pop(R9);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2960	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2961	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2962	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2963	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2964	case BarrierSet::CardTableForRS:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2965	case BarrierSet::CardTableExtension:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2966	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2967	BLOCK_COMMENT("CardTablePostBarrier");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2968	CardTableModRefBS* ct = barrier_set_cast<CardTableModRefBS>(bs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2969	assert(sizeof(*ct->byte_map_base) == sizeof(jbyte), "adjust this code");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2970
48104 62d5973082e3 8185591: guarantee(_byte_map[_guard_index] == last_card) failed: card table guard has been modified aharlap parents: 47658 diff changeset	2971	Label L_cardtable_loop, L_done;
62d5973082e3 8185591: guarantee(_byte_map[_guard_index] == last_card) failed: card table guard has been modified aharlap parents: 47658 diff changeset	2972
62d5973082e3 8185591: guarantee(_byte_map[_guard_index] == last_card) failed: card table guard has been modified aharlap parents: 47658 diff changeset	2973	__ cbz_32(count, L_done); // zero count - nothing to do
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2974
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2975	__ add_ptr_scaled_int32(count, addr, count, LogBytesPerHeapOop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2976	__ sub(count, count, BytesPerHeapOop); // last addr
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2977
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2978	__ logical_shift_right(addr, addr, CardTableModRefBS::card_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2979	__ logical_shift_right(count, count, CardTableModRefBS::card_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2980	__ sub(count, count, addr); // nb of cards
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2981
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2982	// warning: Rthread has not been preserved
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2983	__ mov_address(tmp, (address) ct->byte_map_base, symbolic_Relocation::card_table_reference);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2984	__ add(addr,tmp, addr);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2985
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2986	Register zero = __ zero_register(tmp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2987
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2988	__ BIND(L_cardtable_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2989	__ strb(zero, Address(addr, 1, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2990	__ subs(count, count, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2991	__ b(L_cardtable_loop, ge);
48104 62d5973082e3 8185591: guarantee(_byte_map[_guard_index] == last_card) failed: card table guard has been modified aharlap parents: 47658 diff changeset	2992	__ BIND(L_done);
42664 29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2993	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2994	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2995	case BarrierSet::ModRef:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2996	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2997	default:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2998	ShouldNotReachHere();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	2999	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3000	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3001
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3002	// Generates pattern of code to be placed after raw data copying in generate_oop_copy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3003	// Includes return from arraycopy stub.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3004	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3005	// Arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3006	// to: destination pointer after copying.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3007	// if 'forward' then 'to' == upper bound, else 'to' == beginning of the modified region
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3008	// count: total number of copied elements, 32-bit int
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3009	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3010	// Blows all volatile (R0-R3 on 32-bit ARM, R0-R18 on AArch64, Rtemp, LR) and 'to', 'count', 'tmp' registers.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3011	void oop_arraycopy_stub_epilogue_helper(Register to, Register count, Register tmp, bool status, bool forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3012	assert_different_registers(to, count, tmp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3013
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3014	if (forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3015	// 'to' is upper bound of the modified region
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3016	// restore initial dst:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3017	__ sub_ptr_scaled_int32(to, to, count, LogBytesPerHeapOop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3018	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3019
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3020	// 'to' is the beginning of the region
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3021
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3022	gen_write_ref_array_post_barrier(to, count, tmp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3023
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3024	if (status) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3025	__ mov(R0, 0); // OK
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3026	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3027
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3028	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3029	__ raw_pop(LR, ZR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3030	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3031	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3032	__ pop(PC);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3033	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3034	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3035
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3036
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3037	// Generate stub for assign-compatible oop copy. If "aligned" is true, the
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3038	// "from" and "to" addresses are assumed to be heapword aligned.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3039	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3040	// If "disjoint" is true, arrays are assumed to be disjoint, otherwise they may overlap and
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3041	// "nooverlap_target" must be specified as the address to jump if they don't.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3042	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3043	// Arguments for generated stub:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3044	// from: R0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3045	// to: R1
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3046	// count: R2 treated as signed 32-bit int
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3047	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3048	address generate_oop_copy(bool aligned, const char * name, bool status, bool disjoint, address nooverlap_target = NULL) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3049	__ align(CodeEntryAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3050	StubCodeMark mark(this, "StubRoutines", name);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3051	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3052
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3053	Register from = R0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3054	Register to = R1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3055	Register count = R2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3056	Register tmp1 = R3;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3057	Register tmp2 = R12;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3058
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3059
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3060	if (!aligned) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3061	BLOCK_COMMENT("Entry:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3062	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3063
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3064	__ zap_high_non_significant_bits(R2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3065
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3066	if (!disjoint) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3067	assert (nooverlap_target != NULL, "must be specified for conjoint case");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3068	array_overlap_test(nooverlap_target, LogBytesPerHeapOop, tmp1, tmp2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3069	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3070
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3071	inc_counter_np(SharedRuntime::_oop_array_copy_ctr, tmp1, tmp2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3072
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3073	// Conjoint case: since execution reaches this point, the arrays overlap, so performing backward copy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3074	// Disjoint case: perform forward copy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3075	bool forward = disjoint;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3076
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3077	const int bytes_per_count = BytesPerHeapOop;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3078	const int log_bytes_per_count = LogBytesPerHeapOop;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3079
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3080	const Register saved_count = LR;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3081	const int callee_saved_regs = 3; // R0-R2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3082
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3083	// LR is used later to save barrier args
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3084	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3085	__ raw_push(LR, ZR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3086	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3087	__ push(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3088	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3089
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3090	#if INCLUDE_ALL_GCS
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3091	gen_write_ref_array_pre_barrier(to, count, callee_saved_regs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3092	#endif // INCLUDE_ALL_GCS
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3093
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3094	// save arguments for barrier generation (after the pre barrier)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3095	__ mov(saved_count, count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3096
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3097	if (!forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3098	__ add_ptr_scaled_int32(to, to, count, log_bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3099	__ add_ptr_scaled_int32(from, from, count, log_bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3100	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3101
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3102	// for short arrays, just do single element copy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3103	Label L_small_array;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3104	const int small_copy_limit = (8*wordSize + 7)/bytes_per_count; // XXX optim: tune the limit higher ?
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3105	__ cmp_32(count, small_copy_limit);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3106	__ b(L_small_array, le);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3107
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3108	bool from_is_aligned = (bytes_per_count >= 8);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3109	if (aligned && forward && (HeapWordSize % 8 == 0)) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3110	// if 'from' is heapword aligned and HeapWordSize is divisible by 8,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3111	// then from is aligned by 8
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3112	from_is_aligned = true;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3113	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3114
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3115	int count_required_to_align = from_is_aligned ? 0 : align_src(from, to, count, tmp1, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3116	assert (small_copy_limit >= count_required_to_align, "alignment could exhaust count");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3117
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3118	// now 'from' is aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3119
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3120	bool to_is_aligned = false;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3121
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3122	if (bytes_per_count >= wordSize) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3123	// 'to' is aligned by bytes_per_count, so it is aligned by wordSize
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3124	to_is_aligned = true;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3125	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3126	if (aligned && (8 % HeapWordSize == 0) && (HeapWordSize % wordSize == 0)) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3127	// Originally 'from' and 'to' were heapword aligned;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3128	// (from - to) has not been changed, so since now 'from' is 8-byte aligned, then it is also heapword aligned,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3129	// so 'to' is also heapword aligned and thus aligned by wordSize.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3130	to_is_aligned = true;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3131	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3132	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3133
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3134	Label L_unaligned_dst;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3135
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3136	if (!to_is_aligned) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3137	BLOCK_COMMENT("Check dst alignment:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3138	__ tst(to, wordSize - 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3139	__ b(L_unaligned_dst, ne); // 'to' is not aligned
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3140	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3141
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3142	int min_copy;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3143	if (forward) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3144	min_copy = generate_forward_aligned_copy_loop(from, to, count, bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3145	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3146	min_copy = generate_backward_aligned_copy_loop(from, to, count, bytes_per_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3147	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3148	assert(small_copy_limit >= count_required_to_align + min_copy, "first loop might exhaust count");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3149
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3150	oop_arraycopy_stub_epilogue_helper(to, saved_count, /* tmp */ tmp1, status, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3151
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3152	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3153	copy_small_array(from, to, count, tmp1, noreg, bytes_per_count, forward, L_small_array);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3154
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3155	oop_arraycopy_stub_epilogue_helper(to, saved_count, /* tmp */ tmp1, status, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3156	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3157
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3158	if (!to_is_aligned) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3159	// !to_is_aligned <=> UseCompressedOops && AArch64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3160	__ BIND(L_unaligned_dst);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3161	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3162	assert (UseCompressedOops, "unaligned oop array copy may be requested only with UseCompressedOops");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3163	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3164	ShouldNotReachHere();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3165	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3166	int min_copy_shifted = align_dst_and_generate_shifted_copy_loop(from, to, count, bytes_per_count, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3167	assert (small_copy_limit >= count_required_to_align + min_copy_shifted, "first loop might exhaust count");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3168
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3169	oop_arraycopy_stub_epilogue_helper(to, saved_count, /* tmp */ tmp1, status, forward);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3170	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3171
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3172	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3173	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3174
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3175	// Generate 'unsafe' array copy stub
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3176	// Though just as safe as the other stubs, it takes an unscaled
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3177	// size_t argument instead of an element count.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3178	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3179	// Arguments for generated stub:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3180	// from: R0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3181	// to: R1
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3182	// count: R2 byte count, treated as ssize_t, can be zero
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3183	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3184	// Examines the alignment of the operands and dispatches
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3185	// to a long, int, short, or byte copy loop.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3186	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3187	address generate_unsafe_copy(const char* name) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3188
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3189	const Register R0_from = R0; // source array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3190	const Register R1_to = R1; // destination array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3191	const Register R2_count = R2; // elements count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3192
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3193	const Register R3_bits = R3; // test copy of low bits
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3194
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3195	__ align(CodeEntryAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3196	StubCodeMark mark(this, "StubRoutines", name);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3197	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3198	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3199	__ NOT_IMPLEMENTED();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3200	start = NULL;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3201	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3202	const Register tmp = Rtemp;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3203
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3204	// bump this on entry, not on exit:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3205	inc_counter_np(SharedRuntime::_unsafe_array_copy_ctr, R3, tmp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3206
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3207	__ orr(R3_bits, R0_from, R1_to);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3208	__ orr(R3_bits, R2_count, R3_bits);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3209
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3210	__ tst(R3_bits, BytesPerLong-1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3211	__ mov(R2_count,AsmOperand(R2_count,asr,LogBytesPerLong), eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3212	__ jump(StubRoutines::_jlong_arraycopy, relocInfo::runtime_call_type, tmp, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3213
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3214	__ tst(R3_bits, BytesPerInt-1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3215	__ mov(R2_count,AsmOperand(R2_count,asr,LogBytesPerInt), eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3216	__ jump(StubRoutines::_jint_arraycopy, relocInfo::runtime_call_type, tmp, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3217
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3218	__ tst(R3_bits, BytesPerShort-1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3219	__ mov(R2_count,AsmOperand(R2_count,asr,LogBytesPerShort), eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3220	__ jump(StubRoutines::_jshort_arraycopy, relocInfo::runtime_call_type, tmp, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3221
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3222	__ jump(StubRoutines::_jbyte_arraycopy, relocInfo::runtime_call_type, tmp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3223	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3224	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3225	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3226
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3227	// Helper for generating a dynamic type check.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3228	// Smashes only the given temp registers.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3229	void generate_type_check(Register sub_klass,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3230	Register super_check_offset,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3231	Register super_klass,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3232	Register tmp1,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3233	Register tmp2,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3234	Register tmp3,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3235	Label& L_success) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3236	assert_different_registers(sub_klass, super_check_offset, super_klass, tmp1, tmp2, tmp3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3237
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3238	BLOCK_COMMENT("type_check:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3239
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3240	// If the pointers are equal, we are done (e.g., String[] elements).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3241
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3242	__ cmp(super_klass, sub_klass);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3243	__ b(L_success, eq); // fast success
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3244
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3245
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3246	Label L_loop, L_fail;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3247
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3248	int sc_offset = in_bytes(Klass::secondary_super_cache_offset());
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3249
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3250	// Check the supertype display:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3251	__ ldr(tmp1, Address(sub_klass, super_check_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3252	__ cmp(tmp1, super_klass);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3253	__ b(L_success, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3254
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3255	__ cmp(super_check_offset, sc_offset);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3256	__ b(L_fail, ne); // failure
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3257
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3258	BLOCK_COMMENT("type_check_slow_path:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3259
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3260	// a couple of useful fields in sub_klass:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3261	int ss_offset = in_bytes(Klass::secondary_supers_offset());
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3262
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3263	// Do a linear scan of the secondary super-klass chain.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3264
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3265	#ifndef PRODUCT
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3266	int* pst_counter = &SharedRuntime::_partial_subtype_ctr;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3267	__ inc_counter((address) pst_counter, tmp1, tmp2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3268	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3269
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3270	Register scan_temp = tmp1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3271	Register count_temp = tmp2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3272
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3273	// We will consult the secondary-super array.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3274	__ ldr(scan_temp, Address(sub_klass, ss_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3275
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3276	Register search_key = super_klass;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3277
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3278	// Load the array length.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3279	__ ldr_s32(count_temp, Address(scan_temp, Array<Klass*>::length_offset_in_bytes()));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3280	__ add(scan_temp, scan_temp, Array<Klass*>::base_offset_in_bytes());
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3281
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3282	__ add(count_temp, count_temp, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3283
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3284	// Top of search loop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3285	__ bind(L_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3286	// Notes:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3287	// scan_temp starts at the array elements
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3288	// count_temp is 1+size
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3289
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3290	__ subs(count_temp, count_temp, 1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3291	__ b(L_fail, eq); // not found
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3292
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3293	// Load next super to check
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3294	// In the array of super classes elements are pointer sized.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3295	int element_size = wordSize;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3296	__ ldr(tmp3, Address(scan_temp, element_size, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3297
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3298	// Look for Rsuper_klass on Rsub_klass's secondary super-class-overflow list
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3299	__ cmp(tmp3, search_key);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3300
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3301	// A miss means we are NOT a subtype and need to keep looping
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3302	__ b(L_loop, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3303
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3304	// Falling out the bottom means we found a hit; we ARE a subtype
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3305
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3306	// Success. Cache the super we found and proceed in triumph.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3307	__ str(super_klass, Address(sub_klass, sc_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3308
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3309	// Jump to success
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3310	__ b(L_success);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3311
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3312	// Fall through on failure!
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3313	__ bind(L_fail);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3314	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3315
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3316	// Generate stub for checked oop copy.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3317	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3318	// Arguments for generated stub:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3319	// from: R0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3320	// to: R1
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3321	// count: R2 treated as signed 32-bit int
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3322	// ckoff: R3 (super_check_offset)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3323	// ckval: R4 (AArch64) / SP[0] (32-bit ARM) (super_klass)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3324	// ret: R0 zero for success; (-1^K) where K is partial transfer count (32-bit)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3325	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3326	address generate_checkcast_copy(const char * name) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3327	__ align(CodeEntryAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3328	StubCodeMark mark(this, "StubRoutines", name);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3329	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3330
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3331	const Register from = R0; // source array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3332	const Register to = R1; // destination array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3333	const Register count = R2; // elements count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3334
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3335	const Register R3_ckoff = R3; // super_check_offset
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3336	const Register R4_ckval = R4; // super_klass
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3337
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3338	const int callee_saved_regs = AARCH64_ONLY(5) NOT_AARCH64(4); // LR saved differently
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3339
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3340	Label load_element, store_element, do_card_marks, fail;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3341
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3342	BLOCK_COMMENT("Entry:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3343
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3344	__ zap_high_non_significant_bits(R2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3345
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3346	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3347	__ raw_push(LR, ZR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3348	__ raw_push(R19, R20);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3349	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3350	int pushed = 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3351	__ push(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3352	pushed+=1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3353	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3354
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3355	#if INCLUDE_ALL_GCS
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3356	gen_write_ref_array_pre_barrier(to, count, callee_saved_regs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3357	#endif // INCLUDE_ALL_GCS
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3358
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3359	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3360	const RegisterSet caller_saved_regs = RegisterSet(R4,R6) \| RegisterSet(R8,R9) \| altFP_7_11;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3361	__ push(caller_saved_regs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3362	assert(caller_saved_regs.size() == 6, "check the count");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3363	pushed+=6;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3364
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3365	__ ldr(R4_ckval,Address(SP, wordSize*pushed)); // read the argument that was on the stack
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3366	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3367
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3368	// Save arguments for barrier generation (after the pre barrier):
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3369	// - must be a caller saved register and not LR
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3370	// - ARM32: avoid R10 in case RThread is needed
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3371	const Register saved_count = AARCH64_ONLY(R19) NOT_AARCH64(altFP_7_11);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3372	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3373	__ mov_w(saved_count, count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3374	__ cbnz_w(count, load_element); // and test count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3375	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3376	__ movs(saved_count, count); // and test count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3377	__ b(load_element,ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3378	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3379
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3380	// nothing to copy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3381	__ mov(R0, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3382
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3383	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3384	__ raw_pop(R19, R20);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3385	__ raw_pop(LR, ZR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3386	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3387	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3388	__ pop(caller_saved_regs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3389	__ pop(PC);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3390	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3391
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3392	// ======== begin loop ========
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3393	// (Loop is rotated; its entry is load_element.)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3394	__ align(OptoLoopAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3395	__ BIND(store_element);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3396	if (UseCompressedOops) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3397	__ store_heap_oop(R5, Address(to, BytesPerHeapOop, post_indexed)); // store the oop, changes flags
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3398	__ subs_32(count,count,1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3399	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3400	__ subs_32(count,count,1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3401	__ str(R5, Address(to, BytesPerHeapOop, post_indexed)); // store the oop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3402	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3403	__ b(do_card_marks, eq); // count exhausted
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3404
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3405	// ======== loop entry is here ========
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3406	__ BIND(load_element);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3407	__ load_heap_oop(R5, Address(from, BytesPerHeapOop, post_indexed)); // load the oop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3408	__ cbz(R5, store_element); // NULL
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3409
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3410	__ load_klass(R6, R5);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3411
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3412	generate_type_check(R6, R3_ckoff, R4_ckval, /tmps/ R12, R8, R9,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3413	// branch to this on success:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3414	store_element);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3415	// ======== end loop ========
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3416
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3417	// It was a real error; we must depend on the caller to finish the job.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3418	// Register count has number of remaining oops, saved_count number of total oops.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3419	// Emit GC store barriers for the oops we have copied
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3420	// and report their number to the caller (0 or (-1^n))
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3421	__ BIND(fail);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3422
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3423	// Note: fail marked by the fact that count differs from saved_count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3424
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3425	__ BIND(do_card_marks);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3426
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3427	Register copied = AARCH64_ONLY(R20) NOT_AARCH64(R4); // saved
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3428	Label L_not_copied;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3429
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3430	__ subs_32(copied, saved_count, count); // copied count (in saved reg)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3431	__ b(L_not_copied, eq); // nothing was copied, skip post barrier
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3432	__ sub(to, to, AsmOperand(copied, lsl, LogBytesPerHeapOop)); // initial to value
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3433	__ mov(R12, copied); // count arg scratched by post barrier
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3434
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3435	gen_write_ref_array_post_barrier(to, R12, R3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3436
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3437	assert_different_registers(R3,R12,LR,copied,saved_count);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3438	inc_counter_np(SharedRuntime::_checkcast_array_copy_ctr, R3, R12);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3439
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3440	__ BIND(L_not_copied);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3441	__ cmp_32(copied, saved_count); // values preserved in saved registers
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3442
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3443	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3444	__ csinv(R0, ZR, copied, eq); // 0 if all copied else NOT(copied)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3445	__ raw_pop(R19, R20);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3446	__ raw_pop(LR, ZR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3447	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3448	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3449	__ mov(R0, 0, eq); // 0 if all copied
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3450	__ mvn(R0, copied, ne); // else NOT(copied)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3451	__ pop(caller_saved_regs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3452	__ pop(PC);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3453	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3454
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3455	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3456	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3457
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3458	// Perform range checks on the proposed arraycopy.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3459	// Kills the two temps, but nothing else.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3460	void arraycopy_range_checks(Register src, // source array oop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3461	Register src_pos, // source position (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3462	Register dst, // destination array oop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3463	Register dst_pos, // destination position (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3464	Register length, // length of copy (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3465	Register temp1, Register temp2,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3466	Label& L_failed) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3467
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3468	BLOCK_COMMENT("arraycopy_range_checks:");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3469
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3470	// if (src_pos + length > arrayOop(src)->length() ) FAIL;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3471
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3472	const Register array_length = temp1; // scratch
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3473	const Register end_pos = temp2; // scratch
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3474
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3475	__ add_32(end_pos, length, src_pos); // src_pos + length
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3476	__ ldr_s32(array_length, Address(src, arrayOopDesc::length_offset_in_bytes()));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3477	__ cmp_32(end_pos, array_length);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3478	__ b(L_failed, hi);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3479
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3480	// if (dst_pos + length > arrayOop(dst)->length() ) FAIL;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3481	__ add_32(end_pos, length, dst_pos); // dst_pos + length
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3482	__ ldr_s32(array_length, Address(dst, arrayOopDesc::length_offset_in_bytes()));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3483	__ cmp_32(end_pos, array_length);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3484	__ b(L_failed, hi);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3485
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3486	BLOCK_COMMENT("arraycopy_range_checks done");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3487	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3488
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3489	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3490	// Generate generic array copy stubs
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3491	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3492	// Input:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3493	// R0 - src oop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3494	// R1 - src_pos (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3495	// R2 - dst oop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3496	// R3 - dst_pos (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3497	// R4 (AArch64) / SP[0] (32-bit ARM) - element count (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3498	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3499	// Output: (32-bit int)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3500	// R0 == 0 - success
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3501	// R0 < 0 - need to call System.arraycopy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3502	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3503	address generate_generic_copy(const char *name) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3504	Label L_failed, L_objArray;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3505
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3506	// Input registers
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3507	const Register src = R0; // source array oop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3508	const Register src_pos = R1; // source position
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3509	const Register dst = R2; // destination array oop
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3510	const Register dst_pos = R3; // destination position
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3511
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3512	// registers used as temp
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3513	const Register R5_src_klass = R5; // source array klass
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3514	const Register R6_dst_klass = R6; // destination array klass
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3515	const Register R_lh = AARCH64_ONLY(R7) NOT_AARCH64(altFP_7_11); // layout handler
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3516	const Register R8_temp = R8;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3517
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3518	__ align(CodeEntryAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3519	StubCodeMark mark(this, "StubRoutines", name);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3520	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3521
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3522	__ zap_high_non_significant_bits(R1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3523	__ zap_high_non_significant_bits(R3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3524	__ zap_high_non_significant_bits(R4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3525
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3526	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3527	int pushed = 0;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3528	const RegisterSet saved_regs = RegisterSet(R4,R6) \| RegisterSet(R8,R9) \| altFP_7_11;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3529	__ push(saved_regs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3530	assert(saved_regs.size() == 6, "check the count");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3531	pushed+=6;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3532	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3533
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3534	// bump this on entry, not on exit:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3535	inc_counter_np(SharedRuntime::_generic_array_copy_ctr, R5, R12);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3536
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3537	const Register length = R4; // elements count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3538	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3539	__ ldr(length, Address(SP,4*pushed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3540	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3541
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3542
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3543	//-----------------------------------------------------------------------
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3544	// Assembler stubs will be used for this call to arraycopy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3545	// if the following conditions are met:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3546	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3547	// (1) src and dst must not be null.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3548	// (2) src_pos must not be negative.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3549	// (3) dst_pos must not be negative.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3550	// (4) length must not be negative.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3551	// (5) src klass and dst klass should be the same and not NULL.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3552	// (6) src and dst should be arrays.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3553	// (7) src_pos + length must not exceed length of src.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3554	// (8) dst_pos + length must not exceed length of dst.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3555	BLOCK_COMMENT("arraycopy initial argument checks");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3556
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3557	// if (src == NULL) return -1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3558	__ cbz(src, L_failed);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3559
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3560	// if (src_pos < 0) return -1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3561	__ cmp_32(src_pos, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3562	__ b(L_failed, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3563
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3564	// if (dst == NULL) return -1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3565	__ cbz(dst, L_failed);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3566
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3567	// if (dst_pos < 0) return -1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3568	__ cmp_32(dst_pos, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3569	__ b(L_failed, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3570
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3571	// if (length < 0) return -1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3572	__ cmp_32(length, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3573	__ b(L_failed, lt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3574
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3575	BLOCK_COMMENT("arraycopy argument klass checks");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3576	// get src->klass()
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3577	__ load_klass(R5_src_klass, src);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3578
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3579	// Load layout helper
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3580	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3581	// \|array_tag\| \| header_size \| element_type \| \|log2_element_size\|
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3582	// 32 30 24 16 8 2 0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3583	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3584	// array_tag: typeArray = 0x3, objArray = 0x2, non-array = 0x0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3585	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3586
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3587	int lh_offset = in_bytes(Klass::layout_helper_offset());
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3588	__ ldr_u32(R_lh, Address(R5_src_klass, lh_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3589
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3590	__ load_klass(R6_dst_klass, dst);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3591
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3592	// Handle objArrays completely differently...
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3593	juint objArray_lh = Klass::array_layout_helper(T_OBJECT);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3594	__ mov_slow(R8_temp, objArray_lh);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3595	__ cmp_32(R_lh, R8_temp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3596	__ b(L_objArray,eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3597
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3598	// if (src->klass() != dst->klass()) return -1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3599	__ cmp(R5_src_klass, R6_dst_klass);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3600	__ b(L_failed, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3601
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3602	// if (!src->is_Array()) return -1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3603	__ cmp_32(R_lh, Klass::_lh_neutral_value); // < 0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3604	__ b(L_failed, ge);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3605
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3606	arraycopy_range_checks(src, src_pos, dst, dst_pos, length,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3607	R8_temp, R6_dst_klass, L_failed);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3608
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3609	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3610	// TypeArrayKlass
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3611	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3612	// src_addr = (src + array_header_in_bytes()) + (src_pos << log2elemsize);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3613	// dst_addr = (dst + array_header_in_bytes()) + (dst_pos << log2elemsize);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3614	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3615
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3616	const Register R6_offset = R6_dst_klass; // array offset
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3617	const Register R12_elsize = R12; // log2 element size
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3618
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3619	__ logical_shift_right(R6_offset, R_lh, Klass::_lh_header_size_shift);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3620	__ andr(R6_offset, R6_offset, (unsigned int)Klass::_lh_header_size_mask); // array_offset
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3621	__ add(src, src, R6_offset); // src array offset
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3622	__ add(dst, dst, R6_offset); // dst array offset
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3623	__ andr(R12_elsize, R_lh, (unsigned int)Klass::_lh_log2_element_size_mask); // log2 element size
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3624
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3625	// next registers should be set before the jump to corresponding stub
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3626	const Register from = R0; // source array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3627	const Register to = R1; // destination array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3628	const Register count = R2; // elements count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3629
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3630	// 'from', 'to', 'count' registers should be set in this order
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3631	// since they are the same as 'src', 'src_pos', 'dst'.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3632
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3633	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3634
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3635	BLOCK_COMMENT("choose copy loop based on element size and scale indexes");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3636	Label Lbyte, Lshort, Lint, Llong;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3637
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3638	__ cbz(R12_elsize, Lbyte);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3639
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3640	assert (LogBytesPerShort < LogBytesPerInt && LogBytesPerInt < LogBytesPerLong, "must be");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3641	__ cmp(R12_elsize, LogBytesPerInt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3642	__ b(Lint, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3643	__ b(Llong, gt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3644
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3645	__ BIND(Lshort);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3646	__ add_ptr_scaled_int32(from, src, src_pos, LogBytesPerShort);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3647	__ add_ptr_scaled_int32(to, dst, dst_pos, LogBytesPerShort);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3648	__ mov(count, length);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3649	__ b(StubRoutines::_jshort_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3650
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3651	__ BIND(Lint);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3652	__ add_ptr_scaled_int32(from, src, src_pos, LogBytesPerInt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3653	__ add_ptr_scaled_int32(to, dst, dst_pos, LogBytesPerInt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3654	__ mov(count, length);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3655	__ b(StubRoutines::_jint_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3656
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3657	__ BIND(Lbyte);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3658	__ add_ptr_scaled_int32(from, src, src_pos, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3659	__ add_ptr_scaled_int32(to, dst, dst_pos, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3660	__ mov(count, length);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3661	__ b(StubRoutines::_jbyte_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3662
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3663	__ BIND(Llong);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3664	__ add_ptr_scaled_int32(from, src, src_pos, LogBytesPerLong);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3665	__ add_ptr_scaled_int32(to, dst, dst_pos, LogBytesPerLong);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3666	__ mov(count, length);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3667	__ b(StubRoutines::_jlong_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3668
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3669	#else // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3670
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3671	BLOCK_COMMENT("scale indexes to element size");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3672	__ add(from, src, AsmOperand(src_pos, lsl, R12_elsize)); // src_addr
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3673	__ add(to, dst, AsmOperand(dst_pos, lsl, R12_elsize)); // dst_addr
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3674
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3675	__ mov(count, length); // length
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3676
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3677	// XXX optim: avoid later push in arraycopy variants ?
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3678
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3679	__ pop(saved_regs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3680
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3681	BLOCK_COMMENT("choose copy loop based on element size");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3682	__ cmp(R12_elsize, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3683	__ b(StubRoutines::_jbyte_arraycopy,eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3684
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3685	__ cmp(R12_elsize, LogBytesPerShort);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3686	__ b(StubRoutines::_jshort_arraycopy,eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3687
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3688	__ cmp(R12_elsize, LogBytesPerInt);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3689	__ b(StubRoutines::_jint_arraycopy,eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3690
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3691	__ b(StubRoutines::_jlong_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3692
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3693	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3694	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3695
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3696	// ObjArrayKlass
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3697	__ BIND(L_objArray);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3698	// live at this point: R5_src_klass, R6_dst_klass, src[_pos], dst[_pos], length
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3699
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3700	Label L_plain_copy, L_checkcast_copy;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3701	// test array classes for subtyping
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3702	__ cmp(R5_src_klass, R6_dst_klass); // usual case is exact equality
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3703	__ b(L_checkcast_copy, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3704
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3705	BLOCK_COMMENT("Identically typed arrays");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3706	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3707	// Identically typed arrays can be copied without element-wise checks.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3708	arraycopy_range_checks(src, src_pos, dst, dst_pos, length,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3709	R8_temp, R_lh, L_failed);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3710
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3711	// next registers should be set before the jump to corresponding stub
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3712	const Register from = R0; // source array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3713	const Register to = R1; // destination array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3714	const Register count = R2; // elements count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3715
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3716	__ add(src, src, arrayOopDesc::base_offset_in_bytes(T_OBJECT)); //src offset
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3717	__ add(dst, dst, arrayOopDesc::base_offset_in_bytes(T_OBJECT)); //dst offset
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3718	__ add_ptr_scaled_int32(from, src, src_pos, LogBytesPerHeapOop); // src_addr
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3719	__ add_ptr_scaled_int32(to, dst, dst_pos, LogBytesPerHeapOop); // dst_addr
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3720	__ BIND(L_plain_copy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3721	__ mov(count, length);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3722
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3723	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3724	__ pop(saved_regs); // XXX optim: avoid later push in oop_arraycopy ?
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3725	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3726	__ b(StubRoutines::_oop_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3727	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3728
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3729	{
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3730	__ BIND(L_checkcast_copy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3731	// live at this point: R5_src_klass, R6_dst_klass
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3732
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3733	// Before looking at dst.length, make sure dst is also an objArray.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3734	__ ldr_u32(R8_temp, Address(R6_dst_klass, lh_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3735	__ cmp_32(R_lh, R8_temp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3736	__ b(L_failed, ne);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3737
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3738	// It is safe to examine both src.length and dst.length.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3739
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3740	arraycopy_range_checks(src, src_pos, dst, dst_pos, length,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3741	R8_temp, R_lh, L_failed);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3742
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3743	// next registers should be set before the jump to corresponding stub
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3744	const Register from = R0; // source array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3745	const Register to = R1; // destination array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3746	const Register count = R2; // elements count
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3747
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3748	// Marshal the base address arguments now, freeing registers.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3749	__ add(src, src, arrayOopDesc::base_offset_in_bytes(T_OBJECT)); //src offset
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3750	__ add(dst, dst, arrayOopDesc::base_offset_in_bytes(T_OBJECT)); //dst offset
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3751	__ add_ptr_scaled_int32(from, src, src_pos, LogBytesPerHeapOop); // src_addr
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3752	__ add_ptr_scaled_int32(to, dst, dst_pos, LogBytesPerHeapOop); // dst_addr
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3753
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3754	__ mov(count, length); // length (reloaded)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3755
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3756	Register sco_temp = R3; // this register is free now
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3757	assert_different_registers(from, to, count, sco_temp,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3758	R6_dst_klass, R5_src_klass);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3759
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3760	// Generate the type check.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3761	int sco_offset = in_bytes(Klass::super_check_offset_offset());
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3762	__ ldr_u32(sco_temp, Address(R6_dst_klass, sco_offset));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3763	generate_type_check(R5_src_klass, sco_temp, R6_dst_klass,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3764	R8_temp, R9,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3765	AARCH64_ONLY(R10) NOT_AARCH64(R12),
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3766	L_plain_copy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3767
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3768	// Fetch destination element klass from the ObjArrayKlass header.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3769	int ek_offset = in_bytes(ObjArrayKlass::element_klass_offset());
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3770
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3771	// the checkcast_copy loop needs two extra arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3772	const Register Rdst_elem_klass = AARCH64_ONLY(R4) NOT_AARCH64(R3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3773	__ ldr(Rdst_elem_klass, Address(R6_dst_klass, ek_offset)); // dest elem klass
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3774	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3775	__ pop(saved_regs); // XXX optim: avoid later push in oop_arraycopy ?
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3776	__ str(Rdst_elem_klass, Address(SP,0)); // dest elem klass argument
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3777	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3778	__ ldr_u32(R3, Address(Rdst_elem_klass, sco_offset)); // sco of elem klass
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3779	__ b(StubRoutines::_checkcast_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3780	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3781
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3782	__ BIND(L_failed);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3783
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3784	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3785	__ pop(saved_regs);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3786	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3787	__ mvn(R0, 0); // failure, with 0 copied
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3788	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3789
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3790	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3791	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3792
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3793	// Safefetch stubs.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3794	void generate_safefetch(const char* name, int size, address* entry, address* fault_pc, address* continuation_pc) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3795	// safefetch signatures:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3796	// int SafeFetch32(int* adr, int errValue);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3797	// intptr_t SafeFetchN (intptr_t* adr, intptr_t errValue);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3798	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3799	// arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3800	// R0 = adr
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3801	// R1 = errValue
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3802	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3803	// result:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3804	// R0 = *adr or errValue
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3805
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3806	StubCodeMark mark(this, "StubRoutines", name);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3807
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3808	// Entry point, pc or function descriptor.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3809	*entry = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3810
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3811	// Load *adr into c_rarg2, may fault.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3812	*fault_pc = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3813
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3814	switch (size) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3815	case 4: // int32_t
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3816	__ ldr_s32(R1, Address(R0));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3817	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3818
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3819	case 8: // int64_t
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3820	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3821	__ ldr(R1, Address(R0));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3822	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3823	Unimplemented();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3824	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3825	break;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3826
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3827	default:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3828	ShouldNotReachHere();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3829	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3830
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3831	// return errValue or *adr
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3832	*continuation_pc = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3833	__ mov(R0, R1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3834	__ ret();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3835	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3836
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3837	void generate_arraycopy_stubs() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3838
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3839	// Note: the disjoint stubs must be generated first, some of
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3840	// the conjoint stubs use them.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3841
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3842	bool status = false; // non failing C2 stubs need not return a status in R0
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3843
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3844	#ifdef TEST_C2_GENERIC_ARRAYCOPY /* Internal development flag */
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3845	// With this flag, the C2 stubs are tested by generating calls to
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3846	// generic_arraycopy instead of Runtime1::arraycopy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3847
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3848	// Runtime1::arraycopy return a status in R0 (0 if OK, else ~copied)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3849	// and the result is tested to see whether the arraycopy stub should
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3850	// be called.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3851
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3852	// When we test arraycopy this way, we must generate extra code in the
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3853	// arraycopy methods callable from C2 generic_arraycopy to set the
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3854	// status to 0 for those who always succeed (calling the slow path stub might
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3855	// lead to errors since the copy has already been performed).
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3856
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3857	status = true; // generate a status compatible with C1 calls
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3858	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3859
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3860	// these need always status in case they are called from generic_arraycopy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3861	StubRoutines::_jbyte_disjoint_arraycopy = generate_primitive_copy(false, "jbyte_disjoint_arraycopy", true, 1, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3862	StubRoutines::_jshort_disjoint_arraycopy = generate_primitive_copy(false, "jshort_disjoint_arraycopy", true, 2, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3863	StubRoutines::_jint_disjoint_arraycopy = generate_primitive_copy(false, "jint_disjoint_arraycopy", true, 4, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3864	StubRoutines::_jlong_disjoint_arraycopy = generate_primitive_copy(false, "jlong_disjoint_arraycopy", true, 8, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3865	StubRoutines::_oop_disjoint_arraycopy = generate_oop_copy (false, "oop_disjoint_arraycopy", true, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3866
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3867	StubRoutines::_arrayof_jbyte_disjoint_arraycopy = generate_primitive_copy(true, "arrayof_jbyte_disjoint_arraycopy", status, 1, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3868	StubRoutines::_arrayof_jshort_disjoint_arraycopy = generate_primitive_copy(true, "arrayof_jshort_disjoint_arraycopy",status, 2, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3869	StubRoutines::_arrayof_jint_disjoint_arraycopy = generate_primitive_copy(true, "arrayof_jint_disjoint_arraycopy", status, 4, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3870	StubRoutines::_arrayof_jlong_disjoint_arraycopy = generate_primitive_copy(true, "arrayof_jlong_disjoint_arraycopy", status, 8, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3871	StubRoutines::_arrayof_oop_disjoint_arraycopy = generate_oop_copy (true, "arrayof_oop_disjoint_arraycopy", status, true);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3872
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3873	// these need always status in case they are called from generic_arraycopy
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3874	StubRoutines::_jbyte_arraycopy = generate_primitive_copy(false, "jbyte_arraycopy", true, 1, false, StubRoutines::_jbyte_disjoint_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3875	StubRoutines::_jshort_arraycopy = generate_primitive_copy(false, "jshort_arraycopy", true, 2, false, StubRoutines::_jshort_disjoint_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3876	StubRoutines::_jint_arraycopy = generate_primitive_copy(false, "jint_arraycopy", true, 4, false, StubRoutines::_jint_disjoint_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3877	StubRoutines::_jlong_arraycopy = generate_primitive_copy(false, "jlong_arraycopy", true, 8, false, StubRoutines::_jlong_disjoint_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3878	StubRoutines::_oop_arraycopy = generate_oop_copy (false, "oop_arraycopy", true, false, StubRoutines::_oop_disjoint_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3879
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3880	StubRoutines::_arrayof_jbyte_arraycopy = generate_primitive_copy(true, "arrayof_jbyte_arraycopy", status, 1, false, StubRoutines::_arrayof_jbyte_disjoint_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3881	StubRoutines::_arrayof_jshort_arraycopy = generate_primitive_copy(true, "arrayof_jshort_arraycopy", status, 2, false, StubRoutines::_arrayof_jshort_disjoint_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3882	#ifdef _LP64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3883	// since sizeof(jint) < sizeof(HeapWord), there's a different flavor:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3884	StubRoutines::_arrayof_jint_arraycopy = generate_primitive_copy(true, "arrayof_jint_arraycopy", status, 4, false, StubRoutines::_arrayof_jint_disjoint_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3885	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3886	StubRoutines::_arrayof_jint_arraycopy = StubRoutines::_jint_arraycopy;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3887	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3888	if (BytesPerHeapOop < HeapWordSize) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3889	StubRoutines::_arrayof_oop_arraycopy = generate_oop_copy (true, "arrayof_oop_arraycopy", status, false, StubRoutines::_arrayof_oop_disjoint_arraycopy);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3890	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3891	StubRoutines::_arrayof_oop_arraycopy = StubRoutines::_oop_arraycopy;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3892	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3893	StubRoutines::_arrayof_jlong_arraycopy = StubRoutines::_jlong_arraycopy;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3894
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3895	StubRoutines::_checkcast_arraycopy = generate_checkcast_copy("checkcast_arraycopy");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3896	StubRoutines::_unsafe_arraycopy = generate_unsafe_copy("unsafe_arraycopy");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3897	StubRoutines::_generic_arraycopy = generate_generic_copy("generic_arraycopy");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3898
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3899
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3900	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3901
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3902	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3903	#define COMPILE_CRYPTO
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3904	#include "stubRoutinesCrypto_arm.cpp"
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3905	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3906
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3907	#ifdef COMPILER2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3908	// Arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3909	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3910	// Inputs:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3911	// c_rarg0 - source byte array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3912	// c_rarg1 - destination byte array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3913	// c_rarg2 - K (key) in little endian int array
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3914	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3915	address generate_aescrypt_encryptBlock() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3916	__ align(CodeEntryAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3917	StubCodeMark mark(this, "StubRoutines", "aescrypt_encryptBlock");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3918
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3919	Label L_doLast;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3920
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3921	const Register from = c_rarg0; // source array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3922	const Register to = c_rarg1; // destination array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3923	const Register key = c_rarg2; // key array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3924	const Register keylen = R8;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3925
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3926	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3927	__ stp(FP, LR, Address(SP, -2 * wordSize, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3928	__ mov(FP, SP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3929
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3930	__ ldr_w(keylen, Address(key, arrayOopDesc::length_offset_in_bytes() - arrayOopDesc::base_offset_in_bytes(T_INT)));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3931
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3932	__ vld1(V0, Address(from), MacroAssembler::VELEM_SIZE_8, 128); // get 16 bytes of input
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3933
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3934	__ vld1(V1, V2, V3, V4, Address(key, 64, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3935
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3936	int quad = 1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3937	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3938	__ rev32(V2, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3939	__ rev32(V3, V3, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3940	__ rev32(V4, V4, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3941	__ aese(V0, V1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3942	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3943	__ aese(V0, V2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3944	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3945	__ aese(V0, V3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3946	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3947	__ aese(V0, V4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3948	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3949
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3950	__ vld1(V1, V2, V3, V4, Address(key, 64, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3951	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3952	__ rev32(V2, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3953	__ rev32(V3, V3, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3954	__ rev32(V4, V4, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3955	__ aese(V0, V1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3956	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3957	__ aese(V0, V2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3958	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3959	__ aese(V0, V3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3960	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3961	__ aese(V0, V4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3962	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3963
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3964	__ vld1(V1, V2, Address(key, 32, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3965	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3966	__ rev32(V2, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3967
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3968	__ cmp_w(keylen, 44);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3969	__ b(L_doLast, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3970
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3971	__ aese(V0, V1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3972	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3973	__ aese(V0, V2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3974	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3975
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3976	__ vld1(V1, V2, Address(key, 32, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3977	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3978	__ rev32(V2, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3979
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3980	__ cmp_w(keylen, 52);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3981	__ b(L_doLast, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3982
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3983	__ aese(V0, V1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3984	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3985	__ aese(V0, V2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3986	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3987
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3988	__ vld1(V1, V2, Address(key, 32, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3989	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3990	__ rev32(V2, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3991
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3992	__ BIND(L_doLast);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3993
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3994	__ aese(V0, V1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3995	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3996	__ aese(V0, V2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3997
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3998	__ vld1(V1, Address(key), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	3999	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4000	__ eor(V0, V0, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4001
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4002	__ vst1(V0, Address(to), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4003
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4004	__ mov(R0, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4005
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4006	__ mov(SP, FP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4007	__ ldp(FP, LR, Address(SP, 2 * wordSize, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4008	__ ret(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4009
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4010	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4011	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4012
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4013	// Arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4014	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4015	// Inputs:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4016	// c_rarg0 - source byte array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4017	// c_rarg1 - destination byte array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4018	// c_rarg2 - K (key) in little endian int array
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4019	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4020	address generate_aescrypt_decryptBlock() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4021	assert(UseAES, "need AES instructions and misaligned SSE support");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4022	__ align(CodeEntryAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4023	StubCodeMark mark(this, "StubRoutines", "aescrypt_decryptBlock");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4024	Label L_doLast;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4025
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4026	const Register from = c_rarg0; // source array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4027	const Register to = c_rarg1; // destination array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4028	const Register key = c_rarg2; // key array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4029	const Register keylen = R8;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4030
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4031	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4032	__ stp(FP, LR, Address(SP, -2 * wordSize, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4033	__ mov(FP, SP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4034
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4035	__ ldr_w(keylen, Address(key, arrayOopDesc::length_offset_in_bytes() - arrayOopDesc::base_offset_in_bytes(T_INT)));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4036
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4037	__ vld1(V0, Address(from), MacroAssembler::VELEM_SIZE_8, 128); // get 16 bytes of input
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4038
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4039	__ vld1(V5, Address(key, 16, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4040
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4041	int quad = 1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4042	__ rev32(V5, V5, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4043
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4044	__ vld1(V1, V2, V3, V4, Address(key, 64, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4045	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4046	__ rev32(V2, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4047	__ rev32(V3, V3, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4048	__ rev32(V4, V4, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4049	__ aesd(V0, V1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4050	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4051	__ aesd(V0, V2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4052	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4053	__ aesd(V0, V3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4054	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4055	__ aesd(V0, V4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4056	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4057
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4058	__ vld1(V1, V2, V3, V4, Address(key, 64, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4059	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4060	__ rev32(V2, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4061	__ rev32(V3, V3, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4062	__ rev32(V4, V4, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4063	__ aesd(V0, V1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4064	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4065	__ aesd(V0, V2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4066	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4067	__ aesd(V0, V3);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4068	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4069	__ aesd(V0, V4);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4070	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4071
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4072	__ vld1(V1, V2, Address(key, 32, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4073	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4074	__ rev32(V2, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4075
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4076	__ cmp_w(keylen, 44);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4077	__ b(L_doLast, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4078
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4079	__ aesd(V0, V1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4080	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4081	__ aesd(V0, V2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4082	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4083
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4084	__ vld1(V1, V2, Address(key, 32, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4085	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4086	__ rev32(V2, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4087
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4088	__ cmp_w(keylen, 52);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4089	__ b(L_doLast, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4090
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4091	__ aesd(V0, V1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4092	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4093	__ aesd(V0, V2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4094	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4095
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4096	__ vld1(V1, V2, Address(key, 32, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4097	__ rev32(V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4098	__ rev32(V2, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4099
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4100	__ BIND(L_doLast);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4101
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4102	__ aesd(V0, V1);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4103	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4104	__ aesd(V0, V2);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4105
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4106	__ eor(V0, V0, V5, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4107
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4108	__ vst1(V0, Address(to), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4109
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4110	__ mov(R0, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4111
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4112	__ mov(SP, FP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4113	__ ldp(FP, LR, Address(SP, 2 * wordSize, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4114	__ ret(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4115
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4116
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4117	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4118	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4119
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4120	// Arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4121	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4122	// Inputs:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4123	// c_rarg0 - source byte array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4124	// c_rarg1 - destination byte array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4125	// c_rarg2 - K (key) in little endian int array
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4126	// c_rarg3 - r vector byte array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4127	// c_rarg4 - input length
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4128	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4129	// Output:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4130	// x0 - input length
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4131	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4132	address generate_cipherBlockChaining_encryptAESCrypt() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4133	assert(UseAES, "need AES instructions and misaligned SSE support");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4134	__ align(CodeEntryAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4135	StubCodeMark mark(this, "StubRoutines", "cipherBlockChaining_encryptAESCrypt");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4136
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4137	Label L_loadkeys_44, L_loadkeys_52, L_aes_loop, L_rounds_44, L_rounds_52;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4138
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4139	const Register from = c_rarg0; // source array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4140	const Register to = c_rarg1; // destination array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4141	const Register key = c_rarg2; // key array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4142	const Register rvec = c_rarg3; // r byte array initialized from initvector array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4143	// and left with the results of the last encryption block
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4144	const Register len_reg = c_rarg4; // src len (must be multiple of blocksize 16)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4145	const Register keylen = R8;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4146
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4147	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4148	__ stp(FP, LR, Address(SP, -2 * wordSize, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4149	__ mov(FP, SP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4150
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4151	__ mov(R9, len_reg);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4152	__ ldr_w(keylen, Address(key, arrayOopDesc::length_offset_in_bytes() - arrayOopDesc::base_offset_in_bytes(T_INT)));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4153
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4154	__ vld1(V0, Address(rvec), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4155
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4156	__ cmp_w(keylen, 52);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4157	__ b(L_loadkeys_44, cc);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4158	__ b(L_loadkeys_52, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4159
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4160	__ vld1(V17, V18, Address(key, 32, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4161
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4162	int quad = 1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4163	__ rev32(V17, V17, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4164	__ rev32(V18, V18, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4165	__ BIND(L_loadkeys_52);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4166	__ vld1(V19, V20, Address(key, 32, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4167	__ rev32(V19, V19, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4168	__ rev32(V20, V20, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4169	__ BIND(L_loadkeys_44);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4170	__ vld1(V21, V22, V23, V24, Address(key, 64, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4171	__ rev32(V21, V21, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4172	__ rev32(V22, V22, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4173	__ rev32(V23, V23, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4174	__ rev32(V24, V24, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4175	__ vld1(V25, V26, V27, V28, Address(key, 64, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4176	__ rev32(V25, V25, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4177	__ rev32(V26, V26, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4178	__ rev32(V27, V27, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4179	__ rev32(V28, V28, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4180	__ vld1(V29, V30, V31, Address(key), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4181	__ rev32(V29, V29, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4182	__ rev32(V30, V30, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4183	__ rev32(V31, V31, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4184
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4185	__ BIND(L_aes_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4186	__ vld1(V1, Address(from, 16, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4187	__ eor(V0, V0, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4188
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4189	__ b(L_rounds_44, cc);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4190	__ b(L_rounds_52, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4191
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4192	__ aese(V0, V17);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4193	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4194	__ aese(V0, V18);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4195	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4196	__ BIND(L_rounds_52);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4197	__ aese(V0, V19);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4198	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4199	__ aese(V0, V20);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4200	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4201	__ BIND(L_rounds_44);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4202	__ aese(V0, V21);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4203	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4204	__ aese(V0, V22);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4205	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4206	__ aese(V0, V23);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4207	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4208	__ aese(V0, V24);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4209	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4210	__ aese(V0, V25);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4211	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4212	__ aese(V0, V26);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4213	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4214	__ aese(V0, V27);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4215	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4216	__ aese(V0, V28);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4217	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4218	__ aese(V0, V29);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4219	__ aesmc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4220	__ aese(V0, V30);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4221	__ eor(V0, V0, V31, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4222
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4223	__ vst1(V0, Address(to, 16, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4224	__ sub(len_reg, len_reg, 16);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4225	__ cbnz(len_reg, L_aes_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4226
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4227	__ vst1(V0, Address(rvec), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4228
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4229	__ mov(R0, R9);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4230
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4231	__ mov(SP, FP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4232	__ ldp(FP, LR, Address(SP, 2 * wordSize, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4233	__ ret(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4234
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4235	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4236	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4237
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4238	// Arguments:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4239	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4240	// Inputs:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4241	// c_rarg0 - source byte array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4242	// c_rarg1 - destination byte array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4243	// c_rarg2 - K (key) in little endian int array
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4244	// c_rarg3 - r vector byte array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4245	// c_rarg4 - input length
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4246	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4247	// Output:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4248	// rax - input length
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4249	//
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4250	address generate_cipherBlockChaining_decryptAESCrypt() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4251	assert(UseAES, "need AES instructions and misaligned SSE support");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4252	__ align(CodeEntryAlignment);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4253	StubCodeMark mark(this, "StubRoutines", "cipherBlockChaining_decryptAESCrypt");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4254
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4255	Label L_loadkeys_44, L_loadkeys_52, L_aes_loop, L_rounds_44, L_rounds_52;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4256
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4257	const Register from = c_rarg0; // source array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4258	const Register to = c_rarg1; // destination array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4259	const Register key = c_rarg2; // key array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4260	const Register rvec = c_rarg3; // r byte array initialized from initvector array address
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4261	// and left with the results of the last encryption block
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4262	const Register len_reg = c_rarg4; // src len (must be multiple of blocksize 16)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4263	const Register keylen = R8;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4264
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4265	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4266	__ stp(FP, LR, Address(SP, -2 * wordSize, pre_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4267	__ mov(FP, SP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4268
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4269	__ mov(R9, len_reg);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4270	__ ldr_w(keylen, Address(key, arrayOopDesc::length_offset_in_bytes() - arrayOopDesc::base_offset_in_bytes(T_INT)));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4271
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4272	__ vld1(V2, Address(rvec), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4273
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4274	__ vld1(V31, Address(key, 16, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4275
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4276	int quad = 1;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4277	__ rev32(V31, V31, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4278
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4279	__ cmp_w(keylen, 52);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4280	__ b(L_loadkeys_44, cc);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4281	__ b(L_loadkeys_52, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4282
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4283	__ vld1(V17, V18, Address(key, 32, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4284	__ rev32(V17, V17, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4285	__ rev32(V18, V18, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4286	__ BIND(L_loadkeys_52);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4287	__ vld1(V19, V20, Address(key, 32, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4288	__ rev32(V19, V19, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4289	__ rev32(V20, V20, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4290	__ BIND(L_loadkeys_44);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4291	__ vld1(V21, V22, V23, V24, Address(key, 64, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4292	__ rev32(V21, V21, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4293	__ rev32(V22, V22, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4294	__ rev32(V23, V23, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4295	__ rev32(V24, V24, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4296	__ vld1(V25, V26, V27, V28, Address(key, 64, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4297	__ rev32(V25, V25, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4298	__ rev32(V26, V26, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4299	__ rev32(V27, V27, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4300	__ rev32(V28, V28, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4301	__ vld1(V29, V30, Address(key), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4302	__ rev32(V29, V29, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4303	__ rev32(V30, V30, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4304
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4305	__ BIND(L_aes_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4306	__ vld1(V0, Address(from, 16, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4307	__ orr(V1, V0, V0, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4308
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4309	__ b(L_rounds_44, cc);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4310	__ b(L_rounds_52, eq);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4311
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4312	__ aesd(V0, V17);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4313	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4314	__ aesd(V0, V17);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4315	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4316	__ BIND(L_rounds_52);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4317	__ aesd(V0, V19);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4318	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4319	__ aesd(V0, V20);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4320	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4321	__ BIND(L_rounds_44);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4322	__ aesd(V0, V21);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4323	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4324	__ aesd(V0, V22);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4325	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4326	__ aesd(V0, V23);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4327	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4328	__ aesd(V0, V24);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4329	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4330	__ aesd(V0, V25);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4331	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4332	__ aesd(V0, V26);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4333	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4334	__ aesd(V0, V27);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4335	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4336	__ aesd(V0, V28);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4337	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4338	__ aesd(V0, V29);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4339	__ aesimc(V0, V0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4340	__ aesd(V0, V30);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4341	__ eor(V0, V0, V31, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4342	__ eor(V0, V0, V2, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4343
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4344	__ vst1(V0, Address(to, 16, post_indexed), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4345	__ orr(V2, V1, V1, MacroAssembler::VELEM_SIZE_8, quad);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4346
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4347	__ sub(len_reg, len_reg, 16);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4348	__ cbnz(len_reg, L_aes_loop);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4349
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4350	__ vst1(V2, Address(rvec), MacroAssembler::VELEM_SIZE_8, 128);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4351
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4352	__ mov(R0, R9);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4353
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4354	__ mov(SP, FP);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4355	__ ldp(FP, LR, Address(SP, 2 * wordSize, post_indexed));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4356	__ ret(LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4357
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4358	return start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4359	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4360
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4361	#endif // COMPILER2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4362	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4363
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4364	private:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4365
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4366	#undef __
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4367	#define __ masm->
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4368
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4369	//------------------------------------------------------------------------------------------------------------------------
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4370	// Continuation point for throwing of implicit exceptions that are not handled in
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4371	// the current activation. Fabricates an exception oop and initiates normal
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4372	// exception dispatching in this frame.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4373	address generate_throw_exception(const char* name, address runtime_entry) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4374	int insts_size = 128;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4375	int locs_size = 32;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4376	CodeBuffer code(name, insts_size, locs_size);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4377	OopMapSet* oop_maps;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4378	int frame_size;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4379	int frame_complete;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4380
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4381	oop_maps = new OopMapSet();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4382	MacroAssembler* masm = new MacroAssembler(&code);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4383
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4384	address start = __ pc();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4385
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4386	frame_size = 2;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4387	__ mov(Rexception_pc, LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4388	__ raw_push(FP, LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4389
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4390	frame_complete = __ pc() - start;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4391
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4392	// Any extra arguments are already supposed to be R1 and R2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4393	__ mov(R0, Rthread);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4394
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4395	int pc_offset = __ set_last_Java_frame(SP, FP, false, Rtemp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4396	assert(((__ pc()) - start) == __ offset(), "warning: start differs from code_begin");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4397	__ call(runtime_entry);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4398	if (pc_offset == -1) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4399	pc_offset = __ offset();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4400	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4401
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4402	// Generate oop map
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4403	OopMap* map = new OopMap(frame_size*VMRegImpl::slots_per_word, 0);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4404	oop_maps->add_gc_map(pc_offset, map);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4405	__ reset_last_Java_frame(Rtemp); // Rtemp free since scratched by far call
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4406
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4407	__ raw_pop(FP, LR);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4408	__ jump(StubRoutines::forward_exception_entry(), relocInfo::runtime_call_type, Rtemp);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4409
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4410	RuntimeStub* stub = RuntimeStub::new_runtime_stub(name, &code, frame_complete,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4411	frame_size, oop_maps, false);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4412	return stub->entry_point();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4413	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4414
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4415	//---------------------------------------------------------------------------
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4416	// Initialization
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4417
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4418	void generate_initial() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4419	// Generates all stubs and initializes the entry points
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4420
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4421	//------------------------------------------------------------------------------------------------------------------------
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4422	// entry points that exist in all platforms
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4423	// Note: This is code that could be shared among different platforms - however the benefit seems to be smaller than
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4424	// the disadvantage of having a much more complicated generator structure. See also comment in stubRoutines.hpp.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4425	StubRoutines::_forward_exception_entry = generate_forward_exception();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4426
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4427	StubRoutines::_call_stub_entry =
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4428	generate_call_stub(StubRoutines::_call_stub_return_address);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4429	// is referenced by megamorphic call
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4430	StubRoutines::_catch_exception_entry = generate_catch_exception();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4431
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4432	// stub for throwing stack overflow error used both by interpreter and compiler
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4433	StubRoutines::_throw_StackOverflowError_entry = generate_throw_exception("StackOverflowError throw_exception", CAST_FROM_FN_PTR(address, SharedRuntime::throw_StackOverflowError));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4434
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4435	#ifndef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4436	// integer division used both by interpreter and compiler
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4437	StubRoutines::Arm::_idiv_irem_entry = generate_idiv_irem();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4438
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4439	StubRoutines::_atomic_add_entry = generate_atomic_add();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4440	StubRoutines::_atomic_xchg_entry = generate_atomic_xchg();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4441	StubRoutines::_atomic_cmpxchg_entry = generate_atomic_cmpxchg();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4442	StubRoutines::_atomic_cmpxchg_long_entry = generate_atomic_cmpxchg_long();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4443	StubRoutines::_atomic_load_long_entry = generate_atomic_load_long();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4444	StubRoutines::_atomic_store_long_entry = generate_atomic_store_long();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4445	#endif // !AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4446	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4447
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4448	void generate_all() {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4449	// Generates all stubs and initializes the entry points
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4450
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4451	#ifdef COMPILER2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4452	// Generate partial_subtype_check first here since its code depends on
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4453	// UseZeroBaseCompressedOops which is defined after heap initialization.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4454	StubRoutines::Arm::_partial_subtype_check = generate_partial_subtype_check();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4455	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4456	// These entry points require SharedInfo::stack0 to be set up in non-core builds
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4457	// and need to be relocatable, so they each fabricate a RuntimeStub internally.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4458	StubRoutines::_throw_AbstractMethodError_entry = generate_throw_exception("AbstractMethodError throw_exception", CAST_FROM_FN_PTR(address, SharedRuntime::throw_AbstractMethodError));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4459	StubRoutines::_throw_IncompatibleClassChangeError_entry= generate_throw_exception("IncompatibleClassChangeError throw_exception", CAST_FROM_FN_PTR(address, SharedRuntime::throw_IncompatibleClassChangeError));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4460	StubRoutines::_throw_NullPointerException_at_call_entry= generate_throw_exception("NullPointerException at call throw_exception", CAST_FROM_FN_PTR(address, SharedRuntime::throw_NullPointerException_at_call));
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4461
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4462	//------------------------------------------------------------------------------------------------------------------------
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4463	// entry points that are platform specific
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4464
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4465	// support for verify_oop (must happen after universe_init)
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4466	StubRoutines::_verify_oop_subroutine_entry = generate_verify_oop();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4467
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4468	// arraycopy stubs used by compilers
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4469	generate_arraycopy_stubs();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4470
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4471	// Safefetch stubs.
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4472	generate_safefetch("SafeFetch32", sizeof(int), &StubRoutines::_safefetch32_entry,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4473	&StubRoutines::_safefetch32_fault_pc,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4474	&StubRoutines::_safefetch32_continuation_pc);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4475	#ifdef AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4476	generate_safefetch("SafeFetchN", wordSize, &StubRoutines::_safefetchN_entry,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4477	&StubRoutines::_safefetchN_fault_pc,
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4478	&StubRoutines::_safefetchN_continuation_pc);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4479	#ifdef COMPILER2
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4480	if (UseAESIntrinsics) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4481	StubRoutines::_aescrypt_encryptBlock = generate_aescrypt_encryptBlock();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4482	StubRoutines::_aescrypt_decryptBlock = generate_aescrypt_decryptBlock();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4483	StubRoutines::_cipherBlockChaining_encryptAESCrypt = generate_cipherBlockChaining_encryptAESCrypt();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4484	StubRoutines::_cipherBlockChaining_decryptAESCrypt = generate_cipherBlockChaining_decryptAESCrypt();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4485	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4486	#endif
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4487	#else
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4488	assert (sizeof(int) == wordSize, "32-bit architecture");
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4489	StubRoutines::_safefetchN_entry = StubRoutines::_safefetch32_entry;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4490	StubRoutines::_safefetchN_fault_pc = StubRoutines::_safefetch32_fault_pc;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4491	StubRoutines::_safefetchN_continuation_pc = StubRoutines::_safefetch32_continuation_pc;
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4492	#endif // AARCH64
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4493
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4494	#ifdef COMPILE_CRYPTO
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4495	// generate AES intrinsics code
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4496	if (UseAESIntrinsics) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4497	aes_init();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4498	StubRoutines::_aescrypt_encryptBlock = generate_aescrypt_encryptBlock();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4499	StubRoutines::_aescrypt_decryptBlock = generate_aescrypt_decryptBlock();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4500	StubRoutines::_cipherBlockChaining_encryptAESCrypt = generate_cipherBlockChaining_encryptAESCrypt();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4501	StubRoutines::_cipherBlockChaining_decryptAESCrypt = generate_cipherBlockChaining_decryptAESCrypt();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4502	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4503	#endif // COMPILE_CRYPTO
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4504	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4505
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4506
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4507	public:
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4508	StubGenerator(CodeBuffer* code, bool all) : StubCodeGenerator(code) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4509	if (all) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4510	generate_all();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4511	} else {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4512	generate_initial();
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4513	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4514	}
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4515	}; // end class declaration
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4516
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4517	void StubGenerator_generate(CodeBuffer* code, bool all) {
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4518	StubGenerator g(code, all);
29142a56c193 8168503: JEP 297: Unified arm32/arm64 Port bobv parents: diff changeset	4519	}

author	rfield
	Wed, 13 Dec 2017 14:21:12 -0800
changeset 48347	4f9683bf0923
parent 48104	62d5973082e3
child 49164	7e958a8ebcd3
child 55974	06122633fead
permissions	-rw-r--r--