Gene Mlg_1929 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1929
Symbol
ID	4270130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2192740
End bp	2194146
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	67%
IMG OID	638126683
Product	putative deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_742761
Protein GI	114321078
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCCTG AAGCAACGTC GATGGATTGG GAACGGTTGC TGAGCAAGCA ACGGCTCGGG 
CGCCCCGACG AGGAAGGCAG TCTCGGTTTC CGCACCGATT TCCAGCGGGA TTTCGACCGT 
ATCGTCTTCT CCTCGGCCTT TCGCCGGCTG CAGGACAAGA CCCAGGTCTT CCCGCTGGCG 
GAGAGCGACT ACGTGCGCAC CCGGCTCACC CACAGCCTGG AGGTCTCCTG TGTGGGGCGC 
TCCCTGGGCA CGCGGGTGGG CGAGGCGATC ACCCGTCGCG AGGGCTACAC CGAGGTGGCC 
CCCGGCGACA TCGGCGCCAT CGTGGCAGCC GCCTGCCTGG CCCACGACAT CGGCAACCCG 
CCCTTCGGCC ATGCCGGCGA GGACGCCATC CGCCACTGGG TGCGAACCAG TCCGGTGGCC 
CGCCGGGCGC TGGACGAGTT AAGCCCGCCA CAGCGGGCGG AGTTCGAGCA CTTCGAGGGC 
AATGCCCAGG GCTTCCGGGT GGTCACCCGG CTGCAGAACC CGGACAACCG CGGTGGTCTG 
CAATTGACCT ACGCGACCCT CGGCGCCGCC CTGAAGTACC CCTGCCCCGC CCACGCCATC 
GACCCCGGCT ACGGCATCAG CCGAAAGAAG TACGGCTATT TCGTCGCCGA AGCCGATCTC 
TTCCGCGCTG TGGCCCAGAC CAACGGCCTG CTCAAGCAGG CCCCGCGCAC CTACTGCCGC 
CACCCGCTGG CCTTCGTCAT GGAGGCGGCG GATAACATCG CCTACCTGAT CGTCGACTTC 
GAGGATGCCT TCCGGCTCGG TATCCTGGAG TACCGCACGG TGCACGATCA CTTCCGCGCC 
CTCCTCCGAG GCAAGGACCA GGGCACGGTG GAGCGACGCC TGGCCCGGCT GCGGGACGAC 
AAGGAGCGGG TGGAGTACCT GCGTGCGCGC GCCATCAATG AGCTGGTGGA GGCCAGCGCC 
CGCGCCTTCA TGGATCACGA GGCGGAGATC ATGACCGGTC GCTTCGAGCG GGAACTGACC 
GACACCCTGC CATTCAGTGA GGCCCTGCGC GCTATCGCCG GGGTGTCTCA GGAGCGGATC 
TACGACCACC TGGAGGTGCA GGGGGTGTGC GCGGCGGGTT ACAGCGTGAT CGGCGGCTTG 
CTGGACCTGT TTCATGAGGC GGTCCACGAC ACCGCCGTGG CCCTGGAGGA GGGTAAGCAG 
GCCCCACCGC GCTCGCGCAC TGTGACCAAC CTGGTGCCGG AGCAGTTCCT CTACCAGTAC 
GACCCCGATT CCGGCCGGCG GTATCGGGTC ACCGACCCCT ACCTGTTGCT GCTCAATCTC 
ACCGACTTCA TCGCCGGCAT GACCGACGGC TACGCGGTCT CGCTCTACAA GAAGCTGACC 
GGGATGGCTC TGCCCCACCA CGGCTGA

Protein sequence

MEPEATSMDW ERLLSKQRLG RPDEEGSLGF RTDFQRDFDR IVFSSAFRRL QDKTQVFPLA 
ESDYVRTRLT HSLEVSCVGR SLGTRVGEAI TRREGYTEVA PGDIGAIVAA ACLAHDIGNP 
PFGHAGEDAI RHWVRTSPVA RRALDELSPP QRAEFEHFEG NAQGFRVVTR LQNPDNRGGL 
QLTYATLGAA LKYPCPAHAI DPGYGISRKK YGYFVAEADL FRAVAQTNGL LKQAPRTYCR 
HPLAFVMEAA DNIAYLIVDF EDAFRLGILE YRTVHDHFRA LLRGKDQGTV ERRLARLRDD 
KERVEYLRAR AINELVEASA RAFMDHEAEI MTGRFERELT DTLPFSEALR AIAGVSQERI 
YDHLEVQGVC AAGYSVIGGL LDLFHEAVHD TAVALEEGKQ APPRSRTVTN LVPEQFLYQY 
DPDSGRRYRV TDPYLLLLNL TDFIAGMTDG YAVSLYKKLT GMALPHHG