Gene ECH74115_1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1989
Symbol
ID	6966559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1881737
End bp	1883029
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	47%
IMG OID	643385912
Product	sensory box-containing diguanylate cyclase
Protein accession	YP_002270401
Protein GI	209400929
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.641954
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTGGC TTTTTTGCGA TCGGATAGCA ACAAAAATTG ATAAAAATAA TGGGATCTCA 
ATGATTACGC ACAACTTCAA TACTCTGGAC TTACTCACCA GTCCTGTCTG GATCGTTTCG 
CCCTTTGAGG AACAGTTAAT TTATGCCAAC AGCGCGGCGC GACTGTTGAT GCAAGACCTC 
ACGTTTAGTC AGCTACGAAC CGGTCCCTAT TCCGTCTCCT CACAAAAAGA ACTGCCGAAA 
TACCTCTCCG ATCTGCAAAA CCAACACGAT ATTATCGAAA TCCTCACTGT TCAGCGTAAA 
GAAGAGGAAA CAGCATTAAG CTGTCGGCTT GTTTTGCGAG AGCTGACAGA AACAGAACCG 
GTGATTATTT TCGAAGGTAT CGAAGCGCCG GCAACGCTGG GTTTAAAAGC CAGTCGCTCG 
GCAAATTATC AGCGCAAAAA ACAAGGTTTT TATGCGCGCT TTTTTCTGAC TAACTCTGCA 
CCAATGTTGT TGATTGACCC GTCACGAGAT GGACAAATCG TCGATGCTAA CCTCGCCGCG 
CTCAATTTCT ATGGTTATAA CCATGAAACG ATGTGCCAGA AACATACCTG GGAAATAAAT 
ATGCTCGGGC GTCGCGTCAT GCCTATCATG CATGAAATCT CGCATTTACC CGGTGGTCAT 
AAACCTCTGA ATTTTATTCA TAAGCTGGCG GATGGTTCGA CTCGTCATGT GCAGACCTAT 
GCCGGACCGA TTGAAATTTA TGGCGACAAG CTCATGTTAT GTATTGTGCA TGATATTACT 
GAGCAAAAAC GGCTGGAGGA GCAGCTGGAA CATGCTGCTC ACCATGACGC GATGACCGGA 
TTACTGAATC GGCGACAGTT TTATCACATT ACGGAACCAG GCCAAATGCA GCACCTCGCC 
ATCGCTCAGG ATTACAGCTT ATTGCTCATC GACACAGATC GTTTTAAACA CATTAACGAT 
CTCTATGGGC ATTCTAAAGG TGATGAGGTG TTATGCGCCC TCGCCCGCAC TCTCGAAAGT 
TGCGCTCGCA AAGGCGATTT GGTGTTTCGT TGGGGAGGCG AAGAGTTTGT CTTATTACTA 
CCAAGAACCC CACTGGATAC CGCGCTTTCG CTGGCTGAAA CTATCCGCGT AAGCGTGGCA 
AAAGTGAGTA TTTCGGGCTT ACCACGCTTT ACCGTCAGCA TTGGTGTGGC GCATCACGAA 
GGAAATGAAA GCATCGATGA ACTGTTTAAA CGCGTTGATG ATGCTTTGTA TCGGGCGAAA 
AATGATGGAC GCAACCGCGT GCTGGCGGCA TAA

Protein sequence

MTWLFCDRIA TKIDKNNGIS MITHNFNTLD LLTSPVWIVS PFEEQLIYAN SAARLLMQDL 
TFSQLRTGPY SVSSQKELPK YLSDLQNQHD IIEILTVQRK EEETALSCRL VLRELTETEP 
VIIFEGIEAP ATLGLKASRS ANYQRKKQGF YARFFLTNSA PMLLIDPSRD GQIVDANLAA 
LNFYGYNHET MCQKHTWEIN MLGRRVMPIM HEISHLPGGH KPLNFIHKLA DGSTRHVQTY 
AGPIEIYGDK LMLCIVHDIT EQKRLEEQLE HAAHHDAMTG LLNRRQFYHI TEPGQMQHLA 
IAQDYSLLLI DTDRFKHIND LYGHSKGDEV LCALARTLES CARKGDLVFR WGGEEFVLLL 
PRTPLDTALS LAETIRVSVA KVSISGLPRF TVSIGVAHHE GNESIDELFK RVDDALYRAK 
NDGRNRVLAA