Gene Mlg_1024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1024
Symbol
ID	4270054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1166132
End bp	1167631
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	68%
IMG OID	638125776
Product	polyphosphate:AMP phosphotransferase
Protein accession	YP_741867
Protein GI	114320184
COG category	[S] Function unknown
COG ID	[COG2326] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0970051
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.793106
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAAAAAC GCATCAACCG CCTGATCGAG GGTCAGGCGG ACAAAAAGGA GCGGAAAAAG 
ACGCTGCAGG AGCTGCGCCT GAAGCTGCTG CGCAGCCAGC TGGCCCTGTC CGAGGCTGCC 
GAGATCCCCG TGGTGATCAT GGTCACCGGC CAAGTCGGTA GCGGCCGCGG CGAGACGGTG 
AATCTGCTCA ACAAGTGGCT GGAGAACCGG GGCATGGAGA CCCATGCCTT CGGGCCGCCC 
AATGACGAGG AACGCGCCCG CCCGCCCATG TGGCGGTACT GGCGTAGCCT GCCGCCGGCC 
GGCCGTATAG GGATCTACGT CAACGGCTGG TATGGCGAGG CGGTGATCGA CCGTGTGCAG 
GGTCTGATCG GCCCAGCGGT CCTGGAGACC CGGGTGGAGG AGGTCCGGGA GTTCGAGAAG 
ACCCTGGCCG CCGAGGGCGC GCTGATCCTG AAGTTCTGGT ACCGAATCTC CCGCGAGCGG 
CAGGCCGAGC GCCTGCACCA GCTGGAGTCC GACCCGGTCA ACCGCTGGCG GGTCAATGAG 
TTGTCCTGGC TACGCCACGA GCAGTTTGAC GCCATCGACG AGACCGCCCA CCAGGTGGTG 
GAGGCCACCG ACAGCGCCTG GGCCCCCTGG CACGTGCTGG AGGGCGGGCA CCCGGAGCGG 
CAAACGCTGC AGACCGCCGC CATCATCCTG GACCGGATGC AGGACCGGCT GAGGGGTCGG 
CGGGAGGAGG TGGAGAGCGC CCGCGCCCCG GTCAAATGCC GTCCCGCGCG CGATCCACAG 
ACCCTGGAGG CGCTGGACCT GACCCAGACC CTGGACAAGA CCACCTACCA CGAAGAACTG 
ACCCGCTGGC AGGACCGGCT CAGTCAACTG GTGCGGGATC CGGTGTTCCG TCGCGACTAC 
GCCGTGGTGG CGGTCTTCGA GGGCCACGAC GCCGCCGGCA AGGGCGGCAG CATCCACCGG 
GTCACCGCCG CCCTGGACGC CCGCCACTAC CGGGTGATCA GCGTGGCGGC GCCCACCGAC 
GAGGAGCGCG CGCAGCCCTG GATTTGGCGC TTCTGGCGGC AACTGCCCTC GCACGGCCGG 
ATGACCATCT TCGATCGCTC CTGGTACGGG CGCGTCCTGG TGGAACGGGT GGAGGGCTTC 
GCCGAGCGGA CCGACTGGCG CCGCGCCTAT GGCGAGATCA ACCACTTTGA GCAGAACCTC 
CTGAGGAGCA ATATTATCCT CGCCAAGTTC TGGCTCGCCA TCGACGCCGA CGAGCAGCTC 
GCCCGCTTCC AGGCGCGCGC GGAGACACCG TGGAAGGCGC ACAAGCTGAC CGAGGAGGAC 
TGGCGTAACC GGGAGCGGTG GGACGACTAC CAGGCCGCCA TCAACGACAT GCTGCGCTAC 
ACCGATACCA CCGCCGCGCC CTGGCACGTG ATCGAGGCCA ATGACAAACG CTTCGCCCGG 
GTCAAAGTGA TCAAGCGGCT CTGTGCCGCC ATTGAGGGAG CCATGGAGAG CGGCGGCTGA

Protein sequence

MQKRINRLIE GQADKKERKK TLQELRLKLL RSQLALSEAA EIPVVIMVTG QVGSGRGETV 
NLLNKWLENR GMETHAFGPP NDEERARPPM WRYWRSLPPA GRIGIYVNGW YGEAVIDRVQ 
GLIGPAVLET RVEEVREFEK TLAAEGALIL KFWYRISRER QAERLHQLES DPVNRWRVNE 
LSWLRHEQFD AIDETAHQVV EATDSAWAPW HVLEGGHPER QTLQTAAIIL DRMQDRLRGR 
REEVESARAP VKCRPARDPQ TLEALDLTQT LDKTTYHEEL TRWQDRLSQL VRDPVFRRDY 
AVVAVFEGHD AAGKGGSIHR VTAALDARHY RVISVAAPTD EERAQPWIWR FWRQLPSHGR 
MTIFDRSWYG RVLVERVEGF AERTDWRRAY GEINHFEQNL LRSNIILAKF WLAIDADEQL 
ARFQARAETP WKAHKLTEED WRNRERWDDY QAAINDMLRY TDTTAAPWHV IEANDKRFAR 
VKVIKRLCAA IEGAMESGG