Gene Mlg_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2042
Symbol
ID	4270176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2312667
End bp	2313725
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	66%
IMG OID	638126798
Product	diguanylate phosphodiesterase
Protein accession	YP_742874
Protein GI	114321191
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.281797
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTGTC CAGGTTGCGA GAAGGTCCCG AAGCAACCGC AGGGTGCGGG AACACTCTAC 
ATCCTGCCCG CCCAACCGCA CGCGGCCGCC ACCATCGTCG AGGCCCTGGT GGGCGACGGC 
CTGACGCCAG AGCAGCACGG CGACTCGATC CTAGCCGTGC CGGTGGAGCC CGGGGCGTTG 
AACCGGATCA TGGCGCTGCT CGGCGGTGCC CTGACGCCAC AGGAGCAGGC CGCCTGCCAG 
GCGAATTTCT TCGCCGACGG CGGCGACTGG TCCCCCGAGA CGCTGCTGGC GACCCGCCCG 
CTGGACGTGC TGGTGGCGCG CAGTCAGTTT GTCTGGCTGA ACGAACTGAT CGAGGACCTG 
CGGCTGCAGA TGCACTTTCA GCCCATCGTC CACGCCGATG ATGGCCGCAC GATCTTCGCC 
TACGAATCGC TGGCCCGCGG CCTGGACCAC GCGGGGCAAT TGATCTCCCC GGGCCGGCTC 
TTCCCCGCAG CGCGGGCGGC CAATCTCCTG TTTCACCTGG ATCGGGCGGC ACGCATCAGC 
GCCATCCGAC AATCCCACCA GCACCGTATC CAGCAGCCGG TGTTCATCAA CTTCAATCCC 
ACCGCCATCT ACGACCCGGG CTTCTGCCTG CGTACCACCT TCAAGGAGGT CCGGCGGCTG 
GGCATCGACC CGGCCAATTT CGTCTTCGAG GTGGTGGAGA CCGACTCGGT GACCGACGAG 
ACCCACCTCA AGTCCATCCT CGAGGAGTAC CGCCGGCAGG GCTTTCGTAT CGCACTGGAT 
GACCTGGGGG CGGGATTCGG CTCACTGACA CTGCTGAAAC AGATCCGCCC CGACTTCATC 
AAACTGGACC GGGAACTGGT GGACGGGGTG CACTGGGACA ACTACAAGGC GTCCATCACC 
GCGCACCTGA TCCGCATGGG CAAGGATCTG CAGGTCCGGA TCATCGCCGA GGGCATCGAA 
CAGCCGGAGG ATTGGCACTG GCTGCGCGAG CGCGGCGTGG ACTACGTCCA GGGTTTCCAC 
TTCGCCCGGC CCGCCTCACC GCCTCCCGTC CTGGGCTGA

Protein sequence

MSCPGCEKVP KQPQGAGTLY ILPAQPHAAA TIVEALVGDG LTPEQHGDSI LAVPVEPGAL 
NRIMALLGGA LTPQEQAACQ ANFFADGGDW SPETLLATRP LDVLVARSQF VWLNELIEDL 
RLQMHFQPIV HADDGRTIFA YESLARGLDH AGQLISPGRL FPAARAANLL FHLDRAARIS 
AIRQSHQHRI QQPVFINFNP TAIYDPGFCL RTTFKEVRRL GIDPANFVFE VVETDSVTDE 
THLKSILEEY RRQGFRIALD DLGAGFGSLT LLKQIRPDFI KLDRELVDGV HWDNYKASIT 
AHLIRMGKDL QVRIIAEGIE QPEDWHWLRE RGVDYVQGFH FARPASPPPV LG