Gene Mlg_1831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1831
Symbol
ID	4268186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2089431
End bp	2090381
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	72%
IMG OID	638126587
Product	diguanylate cyclase with PAS/PAC sensor
Protein accession	YP_742665
Protein GI	114320982
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACTGA CCTTTCAGGA ACCCTTGCTG GAGGCCCTGC CCGAGGCGGT GGTCTGGGTG 
CGCCCGGACG GCCGGATCGG CTACCTGAAC CCCCGGGCGT CGCAACTGAC CGGCTGGCCC 
GTGGCGAATG CCCGGGGCCA GCCCCTGGGC GCAGTCCTGC ACTTGGAGGA GCAGGGGCAG 
CCGCTGCCAC CGGAGGCGCT GGTGGCGCAG TGCCGGCAGC TCGGGCAGGC GGGGGAGCGC 
CACGCCCGCC TGCGGCGCCA GGATGGCGAG ACCCTGGAGG TGGCACTGAC CGGGGCCCCG 
ATTCAGGACG GGGCCGGGCA GCCCCGCGGG GTCATCCTCT CGTTCCGCGA CATCGGCGAC 
TACCTGAAGA TGGCCCGGCG GCTCACCTAC GAGGCCAGCC ACGATGGGCT GACCGGGTTG 
GTGAACCGCC GTGAGGCCCT TCGGCGGCTG GAGCGCATGG TGGCGTCGGC CGGGGAGCAG 
TGCTGTGAGC ACGCCCTGTG CTACCTGGAC CTGGATCGTT TCAAGGGCAT CAACGATCTG 
GCCGGCCACG TGGCGGGTGA CCGGGCGCTG GCCGAGGTGG CGGGCCGGCT GCTCGACTGT 
GTGCGCCAAC GGGACACCGT GGCCCGGCTG GGCGGTGATG AGTTTCTGGT GCTGCTGGAG 
CATTGCCCGT TGCTCCAGGC CATCCGGGTG GCCCAGGTGA TCCGCGCGGC CGTCCGGGAC 
TATCGCTTCC ACTGGCGGGG GCAGACGCTG GGGTTGGGGG TGAGCATCGG CCTGGTGCCG 
GTTCTCGGTC ACGGCCCGGG TGCGGAGGCG CTGCTGGAGG TGGCCGACCA GGCCTGCTAC 
GAGGCCAAGC GAAGCGGCGG CATAGGGATT CGGGTCCGGT CCGGGCGGGA GCGCTCAACG 
TGCCAGGCGC AGGAGGACAT AGGCGGCCCC CGTGCCACCA TCACTGGGTA G

Protein sequence

MGLTFQEPLL EALPEAVVWV RPDGRIGYLN PRASQLTGWP VANARGQPLG AVLHLEEQGQ 
PLPPEALVAQ CRQLGQAGER HARLRRQDGE TLEVALTGAP IQDGAGQPRG VILSFRDIGD 
YLKMARRLTY EASHDGLTGL VNRREALRRL ERMVASAGEQ CCEHALCYLD LDRFKGINDL 
AGHVAGDRAL AEVAGRLLDC VRQRDTVARL GGDEFLVLLE HCPLLQAIRV AQVIRAAVRD 
YRFHWRGQTL GLGVSIGLVP VLGHGPGAEA LLEVADQACY EAKRSGGIGI RVRSGRERST 
CQAQEDIGGP RATITG