Gene EcHS_A1458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1458
Symbol
ID	5591666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1452815
End bp	1454107
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	47%
IMG OID	640920613
Product	sensory box-containing diguanylate cyclase
Protein accession	YP_001458171
Protein GI	157160853
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTGGC TTTTTTGCGA TCGGATAGCA ACAAAAATTG ATAAAAATAA CGGGATCTCA 
ATGATTACGC ACAACTTCAA TACCCTGGAC TTACTCACCA GTCCTGTCTG GATCGTTTCG 
CCCTTTGAGG AACAGTTAAT TTATGCCAAT AGCGCGGCGA AACTGTTGAT GCAAGACCTC 
ACGTTTAGTC AGCTACGAAC CGGACCCTAT TCCGTCTCCT CACAAAAAGA ACTGCCGAAA 
TACCTCTCCG ATCTGCAAAA CCAACACGAT ATTATCGAAA TCCTCACTGT TCAGCGTAAA 
GAAGAGGAAA CAGCATTGAG CTGTCGGCTT GTTTTGCGAA AGCTGACAGA AACAGAACCG 
GTGATTATTT TCGAAGGTAT CGAAGCGCCG GCAACGCTGG GTTTAAAAGC CAGTCGCTCG 
GCAAATTATC AGCGCAAAAA ACAAGGTTTT TATGCGCGCT TTTTTCTGAC TAACTCTGCA 
CCAATGTTGT TGATTGACCC GTCACGAGAT GGACAAATCG TCGATGCTAA CCTCGCCGCG 
CTCAATTTCT ATGGTTATAA CCATGAAACG ATGTGCCAGA AACATACCTG GGAAATAAAT 
ATGCTCGGGC GTCGCGTCAT GCCTATCATG CATGAAATCT CGCATTTACC CGGTGGTCAT 
AAGCCTTTGA ATTTTGTTCA TAAACTGGCG GATGGTTCGA CTCGTCATGT GCAGACCTAT 
GCCGGACCGA TTGAAATTTA TGGCGACAAG CTCATGTTAT GTATTGTGCA TGATATTACT 
GAGCAAAAAC GGCTGGAGGA GCAGCTGGAA CATGCTGCTC ACCATGACGC GATGACCGGA 
TTACTGAATC GGCGACAGTT TTATCACATT ACGGAACCAG GCCAAATGCA GCATCTCGCC 
ATCGCTCAGG ATTACAGCTT GTTGCTCATC GACACCGATC GTTTTAAACA CATTAACGAT 
CTCTATGGGC ATTCTAAAGG TGATGAGGTG TTATGCGCCC TCGCCCGCAC CCTCGAAAGT 
TGCGCTCGCA AAGGCGATTT GGTGTTTCGT TGGGGAGGCG AAGAGTTTGT CTTATTGCTA 
CCAAGAACCC CACTGGATAC CGCGCTTTCG CTGGCTGAAA CTATCCGCGT AAGCGTGGCA 
AAAGTGAGTA TTTCGGGCTT ACCACGCTTT ACCGTCAGCA TTGGTGTGGC GCATCACGAA 
GGAAATGAAA GCATCGATGA ACTGTTTAAA CGCGTTGATG ATGCTTTGTA TCGGGCGAAA 
AATGATGGAC GCAACCGCGT GCTGGCGGCA TAA

Protein sequence

MTWLFCDRIA TKIDKNNGIS MITHNFNTLD LLTSPVWIVS PFEEQLIYAN SAAKLLMQDL 
TFSQLRTGPY SVSSQKELPK YLSDLQNQHD IIEILTVQRK EEETALSCRL VLRKLTETEP 
VIIFEGIEAP ATLGLKASRS ANYQRKKQGF YARFFLTNSA PMLLIDPSRD GQIVDANLAA 
LNFYGYNHET MCQKHTWEIN MLGRRVMPIM HEISHLPGGH KPLNFVHKLA DGSTRHVQTY 
AGPIEIYGDK LMLCIVHDIT EQKRLEEQLE HAAHHDAMTG LLNRRQFYHI TEPGQMQHLA 
IAQDYSLLLI DTDRFKHIND LYGHSKGDEV LCALARTLES CARKGDLVFR WGGEEFVLLL 
PRTPLDTALS LAETIRVSVA KVSISGLPRF TVSIGVAHHE GNESIDELFK RVDDALYRAK 
NDGRNRVLAA