Gene Nmag_1121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_1121
Symbol
ID	8823952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	+
Start bp	1141293
End bp	1142561
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	64%
IMG OID
Product	arsenite-activated ATPase ArsA
Protein accession	YP_003479267
Protein GI	289580801
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGGAA TCGACGTCGA AGTCGTCGAC GAGGACGACG CGAATACTGC AGCAGACGGC 
GGGGACGAGG GCGATGGCGA GTCGGACAAC ACCATCGAGG TCACGCCCAC CAGTTCGACC 
GACTCCGCAG ACGTAGAGCC GGACGAAGAC CGCACAACCA TCGATGTCGA ACCGTCCGAC 
GAGCCAATCG ACGGCCCCGA CTATATCCTC TACGGCGGCA AGGGTGGCGT CGGCAAGACG 
ACCATGGCCG CGGCCACCGC ACTCGACAGC GCCCGCGGCG GCACCAGTAC GCTCGTCGTC 
TCGACGGACC CCGCCCACTC CCTCTCTGAC ACCTTCGAGA GGGACGTCCC CGCAGAACCC 
GCCCGGCTGC GCGAGGATAT CCCACTGTAC GGCGCTGAAA TTGACCCCGA GGCGGCCGCT 
GAGCGTGGAC AGGCCGTCTT TGGGAGTAAC GCGAGTGCAG ACTCAGACAC TGACCCCGAG 
TGGGAAGCCA ATGGACTCGG CGACGACGGC TTCGGCGGCG ACAGCAGCCC CTTCGGCGAC 
GACCAGGGCG GCCTCGGCGG CATCGGCCAA CTCCTCGGCG ATGACAATCC CATGGACGCC 
CTCTTCGGCG GTTCCATGCC AGGTGCCGAC GAAGCTGCCG CGATGCAGTT GCTACTCGAG 
TACATGGATG ACCCGCGATT CGAGCGCGTC GTCATCGACA CCGCGCCGAC GGGTCACACC 
CTTAGACTGC TCCAGTTACC CGAAATCATG GACTCGATGG TCGGGAAAAT TCTGCAGTTC 
CGCCAGCGTA TGAGCGGCCT CTTCGAGGGA ATGAAGGGGA TGTTCGGCGG ACAGGACCAG 
CCGGCAGACC AGACGCCGGA TCTCTCCGAT CTAGACGAAC TCCAGGAGCG GATCGAGCGC 
CTGCGGGCGG CGCTCCAGGA TCCGACACGG ACGGACTTCC GGATCGTGAT GATTCCCGAG 
GAGATGAGCG TCTACGAGTC GACGCGGCTG CGCCAGCAGC TTCAGGAGTT CGACATTCCG 
GTCGGTACGG TCGTCGTCAA CCGTGTGATG GAGCCGCTGT CGAACGTAAC CGACGACGTG 
CGCGGCGAGT TCTTACAGCC GAATCTGGAC GACTGTGAGT TCTGCCAACG GCGCTGGGAT 
GTCCAGCAGT CCGCCCTTGC TGAGGCACAG GACCTCTTTC GCGGACCGGA CGTTCGGCGC 
GTCCCGCTGT TCGCGGATGA AGTCCGTGGT GAGGGCATGC TCGAGGTCGT GGCGGCCTGT 
CTGCGATAA

Protein sequence

MSGIDVEVVD EDDANTAADG GDEGDGESDN TIEVTPTSST DSADVEPDED RTTIDVEPSD 
EPIDGPDYIL YGGKGGVGKT TMAAATALDS ARGGTSTLVV STDPAHSLSD TFERDVPAEP 
ARLREDIPLY GAEIDPEAAA ERGQAVFGSN ASADSDTDPE WEANGLGDDG FGGDSSPFGD 
DQGGLGGIGQ LLGDDNPMDA LFGGSMPGAD EAAAMQLLLE YMDDPRFERV VIDTAPTGHT 
LRLLQLPEIM DSMVGKILQF RQRMSGLFEG MKGMFGGQDQ PADQTPDLSD LDELQERIER 
LRAALQDPTR TDFRIVMIPE EMSVYESTRL RQQLQEFDIP VGTVVVNRVM EPLSNVTDDV 
RGEFLQPNLD DCEFCQRRWD VQQSALAEAQ DLFRGPDVRR VPLFADEVRG EGMLEVVAAC 
LR