d8/d50/arm128d__types_8h_source.html

#ifndef AMPGEN_ARM128d_TYPES

#define AMPGEN_ARM128d_TYPES 1


#include <arm_neon.h>

#include <array>

#include <iostream>

#include "AmpGen/Complex.h"

#ifdef _OPENMP

#include <omp.h>

#endif

#include <cmath>


#if USE_MVEC

extern "C" void    _ZGVdN4vvv_sincos(__m256d x, __m256i ptrs, __m256i ptrc);

#define libmvec_alias( function_name) \

  extern "C" __m256d _ZGVcN4v_##function_name(__m256d x);                                    \

inline real_v function_name( const real_v& v ){ return _ZGVcN4v_##function_name (v) ; }

#else


#define libmvec_alias( F ) \

  inline real_v F( const real_v& v ){ auto arr = v.to_ptr(); return real_v( std::F(arr[0]), std::F(arr[1]) ); }


#endif


namespace AmpGen {


  namespace ARM128d {


    struct real_v {

      float64x2_t data;

      static constexpr unsigned size = 2;

      typedef double scalar_type;

      real_v() = default;

      real_v(float64x2_t data ) : data(data) {}

      explicit real_v( uint64x2_t&& data ) : data( vcvtq_f64_u64(data) ) {}

      explicit real_v(  int64x2_t&& data ) : data( vcvtq_f64_s64(data) ) {}

      real_v(const scalar_type& f ) : data(vmovq_n_f64(f)) {}


      real_v(const scalar_type& x0, const scalar_type& x1 )

      {

        data = vsetq_lane_f64(x0, data, 0 );

        data = vsetq_lane_f64(x1, data, 1 );

      }


      explicit real_v(const scalar_type* f ) : data(  vld1q_f64( f ) ) {}

      real_v(const std::array<scalar_type, size> f ) : data(  vld1q_f64( f.data() ) ) {}

      void store( scalar_type* ptr ) const { vst1q_f64(ptr, data); }

      const scalar_type* to_ptr() const { return reinterpret_cast<const scalar_type*>( &data ) ; }

      scalar_type* to_ptr()       { return reinterpret_cast<scalar_type*>( &data ) ; }

      std::array<scalar_type, size> to_array() const { std::array<scalar_type, size> b; store( &b[0] ); return b; }

      int64x2_t to_int() const { return vcvtq_s64_f64(data); }

      double at(const unsigned i) const { return to_ptr()[i]; }

      operator float64x2_t() const { return data ; }

      inline real_v operator+=(const real_v& rhs );

      inline real_v operator-=(const real_v& rhs );

      inline real_v operator*=(const real_v& rhs );

      inline real_v operator/=(const real_v& rhs );

    };


    struct int_v { int_v( uint64x2_t&& data) : data(data){}; uint64x2_t data; operator uint64x2_t() const { return data;} };


    inline real_v operator+( const real_v& lhs, const real_v& rhs ) { return  vaddq_f64(lhs, rhs); }

    inline real_v operator-( const real_v& lhs, const real_v& rhs ) { return  vsubq_f64(lhs, rhs); }

    inline real_v operator*( const real_v& lhs, const real_v& rhs ) { return  vmulq_f64(lhs, rhs); }

    inline real_v operator/( const real_v& lhs, const real_v& rhs ) { return  vdivq_f64(lhs, rhs); }

    inline real_v operator-( const real_v& x ) { return -1.f * x; }


    // inline real_v operator&( const real_v& lhs, const real_v& rhs ) { return real_v( vceqq_f64( lhs, rhs ) ); }

    // inline real_v operator|( const real_v& lhs, const real_v& rhs ) { return _mm256_or_pd( lhs, rhs ); }

    // inline real_v operator^( const real_v& lhs, const real_v& rhs ) { return _mm256_xor_pd( lhs, rhs ); }

    inline int_v operator&&( const int_v& lhs, const int_v& rhs ) { return vandq_u64( lhs, rhs ); }

    inline int_v operator||( const int_v& lhs, const int_v& rhs ) { return vorrq_u64( lhs, rhs ); }

    // inline real_v operator!( const real_v& x ) { return x ^ _mm256_castsi256_pd( _mm256_set1_epi32( -1 ) ); }


    inline int_v operator<( const real_v& lhs, const real_v& rhs ) { return vcltq_f64(lhs,rhs); }

    inline int_v operator>( const real_v& lhs, const real_v& rhs ) { return vcgtq_f64(lhs,rhs); }

    inline int_v operator<=( const real_v& lhs, const real_v& rhs ){ return vcleq_f64( lhs, rhs ); }

    inline int_v operator>=( const real_v& lhs, const real_v& rhs ){ return vcleq_f64( lhs, rhs ); }

    inline int_v operator==( const real_v& lhs, const real_v& rhs ){ return vceqq_f64( lhs, rhs); }

    inline real_v sqrt( const real_v& v ) { return vsqrtq_f64(v); }

    inline real_v abs ( const real_v& v ) { return vabsq_f64(v); }

    inline real_v real_v::operator+=(const real_v& rhs ){ *this = *this + rhs; return *this; }

    inline real_v real_v::operator-=(const real_v& rhs ){ *this = *this - rhs; return *this; }

    inline real_v real_v::operator*=(const real_v& rhs ){ *this = *this * rhs; return *this; }

    inline real_v real_v::operator/=(const real_v& rhs ){ *this = *this / rhs; return *this; }

    libmvec_alias( sin )

      libmvec_alias( cos )

      libmvec_alias( exp )

      libmvec_alias( log )


      inline void sincos( const real_v& v, real_v& s, real_v& c )

      {

        s = sin(v);

        c = cos(v);

      }


    inline std::pair<real_v, real_v> sincos( const real_v& v )

    {

      std::pair<real_v, real_v> rt;

      sincos( v, rt.first, rt.second );

      return rt;

    }


    inline real_v tan( const real_v& v )

    {

      auto [s,c] = sincos( v );

      return s / c ;

    }


    inline std::array<uint64_t, real_v::size> store( const int_v& v )

    {

      std::array<uint64_t, real_v::size> rt;

      vst1q_u64( rt.data(), v );

      return rt;

    }


    inline real_v select(const int_v& mask, const real_v& a, const real_v& b ) { return vbslq_f64(mask, a, b); }

    inline real_v select(const bool& mask  , const real_v& a, const real_v& b ) { return mask ? a : b; }

    inline real_v sign  ( const real_v& v){ return select( v > real_v(0.), +1., -1. ); }


    inline real_v atan2( const real_v& y, const real_v& x ){

      const double* bx = x.to_ptr();

      const double* by = y.to_ptr();

      return real_v ( std::atan2(by[0], bx[0]), std::atan2( by[1], bx[1]) );

    }


    inline real_v gather( const double* base_addr, const real_v& offsets)

    {

      std::array<int64_t, real_v::size> offsets_p;

      vst1q_s64( offsets_p.data(), offsets.to_int() );

      return real_v ( base_addr[offsets_p[0]], base_addr[offsets_p[1]] );

    }


    inline real_v fmadd( const real_v& a, const real_v& b, const real_v& c )

    {

      return vmlaq_f64(a, b, c);

    }


    inline real_v remainder( const real_v& a, const real_v& b ){ return a - b * real_v(vcvtq_u64_f64(a/b)); }

    inline real_v fmod( const real_v& a, const real_v& b ){ return remainder( abs(a), abs(b) ) * sign(a); }


    inline std::ostream& operator<<( std::ostream& os, const real_v& obj ) {

      auto data = obj.to_ptr();

      for( unsigned i = 0 ; i != 4; ++i ) os << data[i] << " ";

      return os;

    }


    template<typename real_v> inline real_v     conj(const real_v& arg ){ return arg ; }

    using complex_v = Complex<real_v>;


    inline complex_v select(const int_v& mask, const complex_v& a, const complex_v& b ) { return complex_v( select(mask, a.re, b.re), select(mask, a.im, b.im ) ) ; }

    inline complex_v select(const int_v& mask, const real_v&    a, const complex_v& b ) { return complex_v( select(mask, a   , b.re), select(mask, 0.f, b.im) ); }

    inline complex_v select(const int_v& mask, const complex_v& a, const real_v& b   )  { return complex_v( select(mask, a.re, b )  , select(mask, a.im, 0.f) ); }

    inline complex_v select(const bool& mask   , const complex_v& a, const complex_v& b ) { return mask ? a : b; }

  }


}


#endif

Complex.h

libmvec_alias
#define libmvec_alias(F)
Definition arm128d_types.h:20

AmpGen::ARM128d
Definition arm128d_types.h:25

AmpGen::ARM128d::complex_v
Complex< real_v > complex_v
Definition arm128d_types.h:136

AmpGen::ARM128d::sincos
void sincos(const real_v &v, real_v &s, real_v &c)
Definition arm128d_types.h:86

AmpGen::ARM128d::tan
real_v tan(const real_v &v)
Definition arm128d_types.h:97

AmpGen::ARM128d::operator==
int_v operator==(const real_v &lhs, const real_v &rhs)
Definition arm128d_types.h:75

AmpGen::ARM128d::operator+
real_v operator+(const real_v &lhs, const real_v &rhs)
Definition arm128d_types.h:58

AmpGen::ARM128d::operator>
int_v operator>(const real_v &lhs, const real_v &rhs)
Definition arm128d_types.h:72

AmpGen::ARM128d::sin
real_v sin(const real_v &v)
Definition arm128d_types.h:82

AmpGen::ARM128d::store
std::array< uint64_t, real_v::size > store(const int_v &v)
Definition arm128d_types.h:102

AmpGen::ARM128d::operator<=
int_v operator<=(const real_v &lhs, const real_v &rhs)
Definition arm128d_types.h:73

AmpGen::ARM128d::atan2
real_v atan2(const real_v &y, const real_v &x)
Definition arm128d_types.h:112

AmpGen::ARM128d::remainder
real_v remainder(const real_v &a, const real_v &b)
Definition arm128d_types.h:127

AmpGen::ARM128d::operator&&
int_v operator&&(const int_v &lhs, const int_v &rhs)
Definition arm128d_types.h:67

AmpGen::ARM128d::operator/
real_v operator/(const real_v &lhs, const real_v &rhs)
Definition arm128d_types.h:61

AmpGen::ARM128d::conj
real_v conj(const real_v &arg)
Definition arm128d_types.h:135

AmpGen::ARM128d::operator*
real_v operator*(const real_v &lhs, const real_v &rhs)
Definition arm128d_types.h:60

AmpGen::ARM128d::fmod
real_v fmod(const real_v &a, const real_v &b)
Definition arm128d_types.h:128

AmpGen::ARM128d::sign
real_v sign(const real_v &v)
Definition arm128d_types.h:111

AmpGen::ARM128d::cos
real_v cos(const real_v &v)
Definition arm128d_types.h:83

AmpGen::ARM128d::operator-
real_v operator-(const real_v &lhs, const real_v &rhs)
Definition arm128d_types.h:59

AmpGen::ARM128d::log
real_v log(const real_v &v)
Definition arm128d_types.h:85

AmpGen::ARM128d::gather
real_v gather(const double *base_addr, const real_v &offsets)
Definition arm128d_types.h:117

AmpGen::ARM128d::select
real_v select(const int_v &mask, const real_v &a, const real_v &b)
Definition arm128d_types.h:109

AmpGen::ARM128d::operator<
int_v operator<(const real_v &lhs, const real_v &rhs)
Definition arm128d_types.h:71

AmpGen::ARM128d::operator>=
int_v operator>=(const real_v &lhs, const real_v &rhs)
Definition arm128d_types.h:74

AmpGen::ARM128d::fmadd
real_v fmadd(const real_v &a, const real_v &b, const real_v &c)
Definition arm128d_types.h:123

AmpGen::ARM128d::sqrt
real_v sqrt(const real_v &v)
Definition arm128d_types.h:76

AmpGen::ARM128d::abs
real_v abs(const real_v &v)
Definition arm128d_types.h:77

AmpGen::ARM128d::operator<<
std::ostream & operator<<(std::ostream &os, const real_v &obj)
Definition arm128d_types.h:130

AmpGen::ARM128d::operator||
int_v operator||(const int_v &lhs, const int_v &rhs)
Definition arm128d_types.h:68

AmpGen::ARM128d::exp
real_v exp(const real_v &v)
Definition arm128d_types.h:84

AmpGen
Definition AddCPConjugate.h:2

AmpGen::real_v
AVX::real_v real_v
Definition utils.h:46

AmpGen::ARM128d::int_v
Definition arm128d_types.h:55

AmpGen::ARM128d::int_v::int_v
int_v(uint64x2_t &&data)
Definition arm128d_types.h:55

AmpGen::ARM128d::int_v::data
uint64x2_t data
Definition arm128d_types.h:55

AmpGen::ARM128d::real_v
Definition arm128d_types.h:27

AmpGen::ARM128d::real_v::operator+=
real_v operator+=(const real_v &rhs)
Definition arm128d_types.h:78

AmpGen::ARM128d::real_v::to_ptr
scalar_type * to_ptr()
Definition arm128d_types.h:45

AmpGen::ARM128d::real_v::to_ptr
const scalar_type * to_ptr() const
Definition arm128d_types.h:44

AmpGen::ARM128d::real_v::real_v
real_v(const scalar_type &f)
Definition arm128d_types.h:35

AmpGen::ARM128d::real_v::real_v
real_v(const scalar_type &x0, const scalar_type &x1)
Definition arm128d_types.h:36

AmpGen::ARM128d::real_v::store
void store(scalar_type *ptr) const
Definition arm128d_types.h:43

AmpGen::ARM128d::real_v::to_int
int64x2_t to_int() const
Definition arm128d_types.h:47

AmpGen::ARM128d::real_v::operator/=
real_v operator/=(const real_v &rhs)
Definition arm128d_types.h:81

AmpGen::ARM128d::real_v::real_v
real_v(int64x2_t &&data)
Definition arm128d_types.h:34

AmpGen::ARM128d::real_v::real_v
real_v(float64x2_t data)
Definition arm128d_types.h:32

AmpGen::ARM128d::real_v::operator-=
real_v operator-=(const real_v &rhs)
Definition arm128d_types.h:79

AmpGen::ARM128d::real_v::size
static constexpr unsigned size
Definition arm128d_types.h:29

AmpGen::ARM128d::real_v::operator*=
real_v operator*=(const real_v &rhs)
Definition arm128d_types.h:80

AmpGen::ARM128d::real_v::real_v
real_v()=default

AmpGen::ARM128d::real_v::real_v
real_v(const std::array< scalar_type, size > f)
Definition arm128d_types.h:42

AmpGen::ARM128d::real_v::data
float64x2_t data
Definition arm128d_types.h:28

AmpGen::ARM128d::real_v::scalar_type
double scalar_type
Definition arm128d_types.h:30

AmpGen::ARM128d::real_v::real_v
real_v(const scalar_type *f)
Definition arm128d_types.h:41

AmpGen::ARM128d::real_v::to_array
std::array< scalar_type, size > to_array() const
Definition arm128d_types.h:46

AmpGen::ARM128d::real_v::at
double at(const unsigned i) const
Definition arm128d_types.h:48

AmpGen::ARM128d::real_v::real_v
real_v(uint64x2_t &&data)
Definition arm128d_types.h:33

AmpGen::Complex
Definition Complex.h:8

AmpGen::Complex::im
real_t im
Definition Complex.h:10

AmpGen::Complex::re
real_t re
Definition Complex.h:9