Gene EcolC_1687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1687
Symbol
ID	6065583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1889101
End bp	1890795
Gene Length	1695 bp
Protein Length	564 aa
Translation table	11
GC content	52%
IMG OID	641601101
Product	diguanylate cyclase
Protein accession	YP_001724666
Protein GI	170019712
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0356503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00372154
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCAGCACG AGACAAAAAT GGAAAACCAG AGCTGGTTGA AAAAACTCGC ACGCCGCCTG 
GGGCCTGGTC ATGTCGTTAA TCTCTGCTTT ATCGTGGTAT TGCTTTTTTC CACCTTGCTC 
ACCTGGCGTG AAGTAGTGGT GCTGGAAGAT GCCTATATCT CCAGCCAGCG TAATCATCTG 
GAAAACGTAG CCAACGCGCT CGATAAGCAT TTGCAGTATA ACGTCGACAA ACTGATCTTT 
TTGCGTAATG GCATGCGCGA AGCTCTCGTA GCGCCACTGG ATTTCACTTC ACTGCGTAAT 
GCTGTAACCG AGTTCGAACA GCATCGCGAC GAGCACGCCT GGCAAATTGA ACTCAACCGA 
CGACGCACCC TGTCAGTCAA TGGCGTATCG GATGCATTAG TCAGCGAGGG GAATCTCCTG 
TCTCGCGAAA ATGAAAGCCT CGACAATGAA ATTACCGCTG CACTGGAAGT TGGTTACTTG 
CTGCGACTGG CGCACAACAC CTCGTCGATG GTTGAACAGG CGATGTATGT CTCGCGTGCC 
GGATTTTACG TTTCGACGCA GCCGACCTTG TTTACGCGCA ATGTACCAAC GCGTTATTAC 
GGCTATGTCA CCCAACCCTG GTTTATCGGC CATTCGCAAC GAGAAAATCG TCACCGCGCG 
GTACGCTGGT TTACTTCGCA ACCGGAACAC GCCAGCAATA CTGAACCGCA GGTTACCGTC 
AGTGTTCCGG TAGACAGTAA TAACTACTGG TATGGCGTGC TGGGGATGAG TATTCCCGTG 
CGTACCATGC AGCAATTTTT AAGAAACGCC ATCGATAAAA ACCTCGATGG TGAGTATCAG 
CTCTATGACA GTAAGCTGAG ATTTTTGACC TCTTCCAATC CTGATCATCC AACAGGGAAT 
ATTTTTGATC CTCGTGAACT GGCCTTGCTG GCGCAGGCAA TGGAACATGA CACGCGGGGC 
GGCATTCGTA TGGACAGTCG CTATGTTAGT TGGGAACGTC TGGACCATTT CGACGGTGTG 
CTGGTGCGCG TCCATACGCT AAGCGAAGGC GTGCGCGGCG ATTTCGGCAG TATCAGCATT 
GCATTAACCC TGCTGTGGGC GCTCTTTACC ACCATGTTAC TCATCTCCTG GTATGTGATT 
CGCCGGATGG TCAGCAACAT GTATGTTCTG CAAAGCTCGT TGCAGTGGCA GGCGTGGCAC 
GACACCTTAA CGCGTTTATA TAACCGTGGC GCACTGTTCG AAAAAGCCCG TCCGCTCGCG 
AAAATGTGTC AGACGCACCA ACATCCTTTT TCTGTCATTC AGGTCGATCT TGACCATTTC 
AAAGCGATTA ATGACCGCTT TGGTCATCAG GCGGGCGACC GTGTTCTTTC TCATGCTGCC 
GGATTAATTA GCAGTTCCTT GCGTGCGCAG GACGTTGCCG GGCGGGTCGG TGGTGAGGAG 
TTTTGTGTGA TTCTGCCAGG CGCGAGTCTG ACGGAGGCTG CGGAAGTCGC AGAACGTATT 
CGCCTGAAGT TAAATGAAAA AGAGATGTTG ATTGCTAAGA GTACGACGAT ACGCATCAGT 
GCCTCGTTGG GGGTAAGTAG CAGCGAGGAA ACCGGTGATT ATGATTTTGA ACAACTCCAG 
TCACTGGCTG ACCGTCGGCT TTATCTCGCT AAACAGGCCG GGCGTAATCG GGTATGCGCG 
AGCGATAACG CTTAA

Protein sequence

MQHETKMENQ SWLKKLARRL GPGHVVNLCF IVVLLFSTLL TWREVVVLED AYISSQRNHL 
ENVANALDKH LQYNVDKLIF LRNGMREALV APLDFTSLRN AVTEFEQHRD EHAWQIELNR 
RRTLSVNGVS DALVSEGNLL SRENESLDNE ITAALEVGYL LRLAHNTSSM VEQAMYVSRA 
GFYVSTQPTL FTRNVPTRYY GYVTQPWFIG HSQRENRHRA VRWFTSQPEH ASNTEPQVTV 
SVPVDSNNYW YGVLGMSIPV RTMQQFLRNA IDKNLDGEYQ LYDSKLRFLT SSNPDHPTGN 
IFDPRELALL AQAMEHDTRG GIRMDSRYVS WERLDHFDGV LVRVHTLSEG VRGDFGSISI 
ALTLLWALFT TMLLISWYVI RRMVSNMYVL QSSLQWQAWH DTLTRLYNRG ALFEKARPLA 
KMCQTHQHPF SVIQVDLDHF KAINDRFGHQ AGDRVLSHAA GLISSSLRAQ DVAGRVGGEE 
FCVILPGASL TEAAEVAERI RLKLNEKEML IAKSTTIRIS ASLGVSSSEE TGDYDFEQLQ 
SLADRRLYLA KQAGRNRVCA SDNA