Gene Nmag_3894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3894
Symbol
ID	8826764
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	+
Start bp	290473
End bp	291621
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	62%
IMG OID
Product	pyruvate dehydrogenase (acetyl-transferring) E1 component, alpha subunit
Protein accession	YP_003481997
Protein GI	289583587
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.361042
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACGC AAAACGAAGC GGACCAGCAA CCAGACAGTG CAACGGCACA CGGCACGGCC 
GATCCACTCC AGATTCTGGA CGCGGACGGA ACCGTGCTGT CGAACGCGAC GGTTCCAGAC 
CTTTCGGACG GCGACCTGAT CGCGATGTAC GAAGACATCA AACTCGCTCG CCGATTCGAT 
CAGCGGGCGA TCAGCCTGCA ACGACAGGGA CGGATCGCGA CGTACGCGCC GATGACAGGA 
CAGGAAGGAG CACAGGTCGC AACCGGGTAC GCGTTGGCAG CGCAAGACTG GCTCCTCCCG 
ACGTATCGAG AGCACGCCGC CAAGTACGTC CACGGAATGG ATCTCGCATC GCTGTTGAAG 
CCACTGTGTG GTCTGCGGGA AGGGTACGCG ATTCCCGACG ACGTAAACGT CATGCCAGAA 
TATATTCCGA TCGCAACGCA GGTACCACAG GCCACCGGTA TGGCCTGGGG GAAGCAACGA 
CAGGGAGAGA CGGATACTGC CGTCCTCTGT CACTTCGGCG ACGGGGCGAC CTCCGAAGGC 
GACTTCCACG AGGGCCTCAA CTTCGCCGGC GTCTTCGACG TCCCCACCGT CTTCGTCTGT 
AACAACAACC AGTGGGCGAT TTCGGTCCCT CGCGAACACC AGACTGCCAG TGAAACCATC 
GCCCAGAAGG CCGCAGCGTA CGGAATAGAG GGGGTCCGAG TCGACGGCCT CGACCCGCTC 
GCCGTCTACG CAGTAACGCG TGCAGCACTC CAGAAGGCGA AGAACCCGGC CGACGACGAA 
CGGCGGCCCA CGCTCATCGA GGCCGTCCAG TACCGCTACG GCGCACACAC GACCGCCGAC 
GACCCATCAA CGTACCGCGA GGAAGACGAG GCCGAGGACT GGCGCGAGAA AGACCCGCTC 
GACCGAATGC AGAACTTCCT CACCAACAGG GGACTGCTCG ACGACGACCT GGAAGCCGAA 
ATCGACGAAC GGATCGAGAC ACAGCTCACC GAGGCGGTCG AGTCCGTCGA AGCAGCAACG 
ACAGACCCGG CGACGATGTT CGATCACGTC TACGACGTAC TTCCTGCTCG CCTTCGTGAG 
CAGCGAGCCG AACTCGAGTC CCTCCGCGAG AAGTACGGCG ACGACGCGTT CCACGAGGTG 
TTAGAATGA

Protein sequence

MSTQNEADQQ PDSATAHGTA DPLQILDADG TVLSNATVPD LSDGDLIAMY EDIKLARRFD 
QRAISLQRQG RIATYAPMTG QEGAQVATGY ALAAQDWLLP TYREHAAKYV HGMDLASLLK 
PLCGLREGYA IPDDVNVMPE YIPIATQVPQ ATGMAWGKQR QGETDTAVLC HFGDGATSEG 
DFHEGLNFAG VFDVPTVFVC NNNQWAISVP REHQTASETI AQKAAAYGIE GVRVDGLDPL 
AVYAVTRAAL QKAKNPADDE RRPTLIEAVQ YRYGAHTTAD DPSTYREEDE AEDWREKDPL 
DRMQNFLTNR GLLDDDLEAE IDERIETQLT EAVESVEAAT TDPATMFDHV YDVLPARLRE 
QRAELESLRE KYGDDAFHEV LE