Gene Sare_1531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1531
Symbol
ID	5708322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1764334
End bp	1766214
Gene Length	1881 bp
Protein Length	626 aa
Translation table	11
GC content	77%
IMG OID	641271042
Product	heavy metal translocating P-type ATPase
Protein accession	YP_001536418
Protein GI	159037165
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2217] Cation transport ATPase
TIGRFAM ID	[TIGR01494] ATPase, P-type (transporting), HAD superfamily, subfamily IC [TIGR01512] heavy metal-(Cd/Co/Hg/Pb/Zn)-translocating P-type ATPase [TIGR01525] heavy metal translocating P-type ATPase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000363104
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAGGCCG AGTCGGAGTG CGTGCCCGAG CGGCCGGCGC GATCCGAGCC GGGCCGCCGG 
CTGCTCTGGG CGCCACTGGG CGGACTGACC GTGCTGGTGC TCGCCGGCGC GGCGGCACGG 
CTCGCCGGCC GGCCCGGCCT CGGTGACGCG CTCTGGGCCG CCGCCACCGT GGCCGCGCTG 
GTGCCGGCCG CCGCCTCGAT GCTGCGCGAG CTCTGGCACC GCCGGTACGG CGTGGACGTC 
ATCGCCGTCC TCGCGCTGGC CGGTGCGCTC GTCGTGCGGG AGTACCTGGC CGGGGCGGTG 
ATCGCGGTGA TGGTCGCCAC CGGCCGGACG CTCGAGGCGT ACGCCCAGGG TCGGGCGACC 
CGCGACCTGC GTGCGCTGCT CGCCCACGCC CCGCGGACCG CACGCCGACG CGCGGCGGAC 
GGCACGATCG AGGTGGTCCC GGCCGACCAG GTCGCTGCGG GGGACCAGCT GTTGGTCGGC 
CCCGGCGACG TGGTGCCGGT GGACGGGCAG CTCGACGCGG CGGCCACCCT CGACGAGTCG 
GTGGTGACCG GCGAGTCGCA ACTGGCCCAG CGCCCCGCTG GGGACCGGGT GGGCAGCGGT 
GTGGTGAACG CCGGTGCCGC GTTCGGCATG CGGGCCACCG CGGAAGCGGC GAACAGCACG 
TACGCCGGGA TCGTGCGGTT GGCGCGTGAG GCCACCGCGC ACAAGGCCCC GACGGTGCGG 
CTGGCCGACC GGTACGCCGT CGCCTTCGTC CCGTTCACCC TGGCGCTCGC CGGGCTGGGT 
TGGCTGGTCT CCGGCGACGT GGTCCGGGCG GTGGCGGTCC TGGTGGTGGC CACGCCCTGC 
CCGCTTCTGT TGGCGACCCC CATCGCCATC GTCTCCGGCC TGTCCCGCAC GGCGCGGCAC 
GGTGTCCTGG TCCGTAACGG TGGCTCCCTC GAACTGCTCG GCCGGGCCCG CACCCTGCTG 
GTGGACAAGA CCGGCACGTT GACCGCCGGC CGGCCTCGGG TGGCCGAGAC GGTGCCGGCG 
CCGGGAACCA CGGCGGACGA GGTGCTGCGC CTCGCCGCCT CCGTGGAGCA GCTCTCCCCG 
CATGTGCTGG GCCGTGCCCT GGTGGAGGGG GCCCGGGAGC GAGGGATCGC CCTCGCCGAA 
CCGGGCGGGG TCACCGAGGA ACCGGGCCGG GGCGTACGGG GGCGGGTGGA CGGCGGTGAG 
GTGTGGGTGG GGCAGCTCGA CGGCCCGCCA CCCGAGTGGG CGGAGCCGGC CCGGGACCGT 
GCCGAGCGGG CCGGCCACTC CCTGGTGTGG GTCGGTGGTA CCGCCGGGCC GCTCGGCGTG 
CTCCTGTTGG CGGACCCGGT CCGGCCCGAC GCGTCGCGGA CCGTCGGCCG GCTGCGGGCG 
GCGGGGCTGC GCCGGATCGT CATGGTCACC GGTGACCGCC CGGCCACCGC TGGTCGGGTG 
GCCCGTCAGG TCGGGGTCGA CGACGTGGTC GCCCACTGCG CGCCCGCCGA GAAGGCGGAG 
CGGGTCCGCG CCGAGGTGGG CCGGGCGGTC ACCGTGATGG TCGGGGACGG GGTGAACGAC 
GCCCCCGCCC TGGCCACCGC CCACGTCGGC GTGGCGATGG GCGCCACCGG GGCGACCGCG 
TCGGCGGATG TCGCCGACGC GGTCCTCACC GTTGACCGAC TGGAACGCCT GGCCGACGCC 
GTGGAGATCG CCCGGTACGC GCGCCGCATC GCGGTGCAGA GCGCCACGGT GGGTATGGGG 
CTCGCCGTGC TGGCCATGTT CGTCGCCGCG GTCGGGCGGC TGCCACCGGT GGCCGGTGCC 
TTCCTCCAGG AGGGCATCGA CGTTCTGGTG ATCCTCAACG CGCTGCGTGC CCTGTTCGGC 
CCGGCCAGCA CGCGACGGTG A

Protein sequence

MEAESECVPE RPARSEPGRR LLWAPLGGLT VLVLAGAAAR LAGRPGLGDA LWAAATVAAL 
VPAAASMLRE LWHRRYGVDV IAVLALAGAL VVREYLAGAV IAVMVATGRT LEAYAQGRAT 
RDLRALLAHA PRTARRRAAD GTIEVVPADQ VAAGDQLLVG PGDVVPVDGQ LDAAATLDES 
VVTGESQLAQ RPAGDRVGSG VVNAGAAFGM RATAEAANST YAGIVRLARE ATAHKAPTVR 
LADRYAVAFV PFTLALAGLG WLVSGDVVRA VAVLVVATPC PLLLATPIAI VSGLSRTARH 
GVLVRNGGSL ELLGRARTLL VDKTGTLTAG RPRVAETVPA PGTTADEVLR LAASVEQLSP 
HVLGRALVEG ARERGIALAE PGGVTEEPGR GVRGRVDGGE VWVGQLDGPP PEWAEPARDR 
AERAGHSLVW VGGTAGPLGV LLLADPVRPD ASRTVGRLRA AGLRRIVMVT GDRPATAGRV 
ARQVGVDDVV AHCAPAEKAE RVRAEVGRAV TVMVGDGVND APALATAHVG VAMGATGATA 
SADVADAVLT VDRLERLADA VEIARYARRI AVQSATVGMG LAVLAMFVAA VGRLPPVAGA 
FLQEGIDVLV ILNALRALFG PASTRR