Gene Mkms_3341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3341
Symbol
ID	4611267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	3503553
End bp	3504818
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	71%
IMG OID	639793014
Product	arsenite-transporting ATPase
Protein accession	YP_939325
Protein GI	119869373
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0464361
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.354276
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCCCA GTGGCGCCGC GGCCCGCATC AGCCTGTTCG TCGGCAAGGG CGGGGTAGGT 
AAGTCCACGC TGGCGACGGC CACCGCCGTC CGCGAGGCGC GGGCGGGTCG TCGTGTGCTC 
ATCGTGTCCA CCGACCAGGC GCACTCCACC GGTGACGTGC TGGGGGAGAC GGTCACCCCG 
ACCGGGCGGC GGGAACCGAC CCGGATCCTC GCCGACCTCG ACGCGGGCAC CCCGGACGCC 
GGTGGCACAC TCGACGCGCT GGCCCTCGAC ACGCTCGCGC TGCTCACCGA GCGGTGGCGG 
GAGATCGCCG GGCCGGTCAC CGCCAGGTTC CCCGACTCGG ACCTGGGTGA TGTTGCGCCA 
GAAGAACTCT CGGCCCTGCC CGGGGTGCAG GAGGTGCTCG GACTGCACGA GGTCGCCGAG 
CTGGCGGCGA GCGGTCTGTG GGAGCACGTC GTCGTCGACT GCGCCTCCAC CGCGGATGCG 
CTGCGCATGC TGACGCTGCC CGGCACGCTC GCGCTCTACC TGGAGCGGGC GTGGCCCAGG 
CACCGCCGGC TGTCGCGCAG CGCCGACGAT GCCGCGTCGG CCGCGATGGT GGACCTCGTC 
GAACGCATCG ACGCGGCGAC CGGGCGGTTG ACCGCCCTGC TCGCCGACGC GTCACAGGTC 
AGTGCGCATC TGGTGCTCAC CGCCGAACGG GTGGTGGCCG CCGAGGCGTC GCGCACGCTG 
GGCTCGCTTT CGCTGATGGG TGTGCGGGTG GCCGAGCTGA TCGTCAATCA AGTTCTGCTG 
CAAGATGATT CGTTTGAGTA TCGGAACCTG CCCGAACATC CGGCGTTCGA CTGGTACGCC 
GAACGCATCT CCGAGCAGAA GTCGGTGCTC GACCACCTCG ACACCGCGAT CGGGGACGTG 
GCGCTGGTGC TGGTGCCCCA CCTGCCCGGG GAGCCGATCG GCCCCAAGGC GTTGGGCGAA 
CTGCTCGACG CCGCGCGCAG GCGTGACGGA TCGGCCCCGC CGGCGCCGGT GCGGCCGATC 
GTCGACCGGG AGTCGGGCAC CGGACTCGAT GCGGTGTACC GGTTGCGGTT AGAGTTGCCG 
CAGGTCGATC CCGGCGAACT CACGTTGGGC CGGGTCGACG ACGACCTGAT CATCGGCGCA 
GGCGGTATGC GGCGCCGCGT CCGACTCGCG TCCGTGCTGC GCAGGTGCAT CGTCACCGAT 
GCGGCGCTGC GGGGAAGCGA GCTGACCGTG CGATTTCGAC CGAATCCGGA GGTGTGGCCG 
GCGTGA

Protein sequence

MNPSGAAARI SLFVGKGGVG KSTLATATAV REARAGRRVL IVSTDQAHST GDVLGETVTP 
TGRREPTRIL ADLDAGTPDA GGTLDALALD TLALLTERWR EIAGPVTARF PDSDLGDVAP 
EELSALPGVQ EVLGLHEVAE LAASGLWEHV VVDCASTADA LRMLTLPGTL ALYLERAWPR 
HRRLSRSADD AASAAMVDLV ERIDAATGRL TALLADASQV SAHLVLTAER VVAAEASRTL 
GSLSLMGVRV AELIVNQVLL QDDSFEYRNL PEHPAFDWYA ERISEQKSVL DHLDTAIGDV 
ALVLVPHLPG EPIGPKALGE LLDAARRRDG SAPPAPVRPI VDRESGTGLD AVYRLRLELP 
QVDPGELTLG RVDDDLIIGA GGMRRRVRLA SVLRRCIVTD AALRGSELTV RFRPNPEVWP 
A