Gene Namu_3232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3232
Symbol
ID	8448846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3560568
End bp	3561797
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	74%
IMG OID	645042311
Product	arsenite-activated ATPase ArsA
Protein accession	YP_003202552
Protein GI	258653396
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.00988964
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000117185
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGAATTG CCCTGCACAC CGGCAAGGGC GGGGTCGGCA AGACGACCAT CTCGGCGGCC 
ACCGCGATCG CGTGTGCCGC CGGCGGGGCG CGCACGCTGC TGGTCTCCAC CGACCCCGCA 
CACTCCATCG CCGACGTGCT CGGCACCCCG GTCAGCGGCG ACCCGACCCC GGTCGTGGGC 
GTCCCCGGGC TGTGGGCCGC CCAGGTCGAC ACCCGCGGCC GCTTCGAGCA GAGCTGGTCG 
CACATCCGCG ACTATCTGGT CGGGGTGCTG GCCGCCCGCG GCATGGCCGA GGTGCAGGCC 
GAGGAACTGG TCGTGCTGCC CGGCGCCGAG GAGATCGTCG CGCTGCTGGA GCTGCGCCGG 
CTGGCCGCCT CCGGTGACTT CGATTCGATC GTGGTCGACT GCGCGCCGAC CGGCGAGACG 
CTGCGGCTGC TGGCGCTGCC CGAGACCATC GGTTTCTACG CCCAGCGCCT GCTCGGCGCG 
CCGCAGCGGG TCCTGCGCAG CATCGCCGCG TCCTTCACCG GCATGCCCGG CGGGCCCAGC 
GCCACCGTGC GGGACGCGGT GGGGGAGCTG CTCTCCGACC TGATGGCCGC GCGGGCGTTG 
CTGGCCGACC CGGAGATCAC CGGGGTCCGG CTGGTGCTGA CTCCCGAACG GATGGTGGTG 
GCCGAGGCCC GCCGGCTGTT CACCGCGCTG TCCCTGCACG GATTCGCCGT CGAGGCGGTC 
ACCGTCAACC GGCTGCTGCC CCGCGGGGTG GGCGGTGATT TCCTGCGCCG TCAGCGGGAG 
AGCCAGCGTG AGGCGATGGT CCAGGTCGAG GAATCGTTCC AGGGCCTGCC CATCCACCGG 
GTCCGGCAAA AGCCCGAGGA GCCCATCGGC GTCGACCAGC TGTCCGAGCT GGCGACCGAC 
ATCTTCGGCT CGGTCGACCC CCTCGCCGTC GCGCCACCCG GTCCGGCGAT CGAGGTCAGC 
GGGTCCGACG GGTGGTACCG CCTGTCGCTG CCGCTGCCGC TGGTCCAGCG CGGCGACATC 
GCGCTTTCCC GGTCCGGCGC CGACCTGGTG GTCACCGTCG GCGACGTCCG CCGGCGGATC 
GCCCTGCCGT CGGTGCTGCA GCGGTGCACG ACCGAGGGCG CCAACTTCGA GGCCGGCCGC 
CTGATCATCG ACTTTGCCGC CGATCCCGCG CTGTGGCCGG CCGCCCTCAC CTCCGGCCTG 
ACCGGGGCGG CGCTGGCCGG TGCCGGGTGA

Protein sequence

MRIALHTGKG GVGKTTISAA TAIACAAGGA RTLLVSTDPA HSIADVLGTP VSGDPTPVVG 
VPGLWAAQVD TRGRFEQSWS HIRDYLVGVL AARGMAEVQA EELVVLPGAE EIVALLELRR 
LAASGDFDSI VVDCAPTGET LRLLALPETI GFYAQRLLGA PQRVLRSIAA SFTGMPGGPS 
ATVRDAVGEL LSDLMAARAL LADPEITGVR LVLTPERMVV AEARRLFTAL SLHGFAVEAV 
TVNRLLPRGV GGDFLRRQRE SQREAMVQVE ESFQGLPIHR VRQKPEEPIG VDQLSELATD 
IFGSVDPLAV APPGPAIEVS GSDGWYRLSL PLPLVQRGDI ALSRSGADLV VTVGDVRRRI 
ALPSVLQRCT TEGANFEAGR LIIDFAADPA LWPAALTSGL TGAALAGAG