Gene EcolC_1839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1839
Symbol
ID	6066355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2037948
End bp	2038973
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	48%
IMG OID	641601253
Product	diguanylate cyclase with GAF sensor
Protein accession	YP_001724815
Protein GI	170019861
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.730013
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.326474
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAGATC AGATTATCGC CCGCGTCTCG CAATCCCTTG CCAAAGAACA GTCACTGGAA 
AGTCTGGTCC GACAGCTTCT GGAGATGCTG GAAATGGTCA CTGATATGGA ATCAACCTAC 
CTGACCAAAG TGGATGTCGA AGCGCGCCTG CAGCATATTA TGTTTGCCCG TAACAGCCAG 
AAAATGCACA TCCCGGAGAA TTTTACCGTC TCGTGGGATT ACTCGTTATG CAAACGCGCC 
ATTGATGAAA ACTGCTTTTT CAGCGATGAA GTCCCCGACC GTTGGGGTGA CTGTATTGCG 
GCACGCAATC TTGGCATCAC CACATTTCTG AGCACGCCAA TTCACTTACC GGATGGATCA 
TTCTATGGCA CGCTTTGCGC CGCCAGCAGT GAGAAGCGCC AGTGGAGTGA ACGCGCGGAA 
CAGGTTTTAC AGTTATTCGC CGGACTGATT GCACAATATA TTCAAAAAGA GGCACTGGTT 
GAACAGCTGC GCGAAGCCAA TGCTGCGCTG ATTGCGCAAT CGTATACCGA CTCGTTAACC 
GGGCTACCGA ATCGGCGGGC GATTTTTGAA AATCTGACGA CACTGTTTTC CCTCGCCCGG 
CATCTTAACC ATAAGATAAT GATCGCGTTT ATCGATCTGG ATAACTTCAA ATTAATCAAT 
GATCGTTTTG GTCATAATAG TGGCGATCTG TTTCTCATTC AGGTTGGCGA GCGCCTTAAT 
ACGCTCCAGC AAAATGGCGA AGTTATTGGT CGTCTCGGCG GTGATGAGTT TTTAGTTGTT 
TCACTAAACA ACGAGAATGC GGATATTTCG TCGCTGCGAG AACGCATTCA GCAGCAAATA 
CGTGGAGAAT ATCACTTAGG TGATGTTGAT TTGTATTATC CCGGTGCCAG TCTTGGCATA 
GTAGAAGTCG ATCCTGAAAC AACCGATGCA GACAGTGCCC TGCATGCTGC CGATATTGCG 
ATGTATCAGG AGAAAAAACA CAAACAGAAA ACACCTTTTG TCGCGCATCC AGCGCTACAT 
TCCTGA

Protein sequence

MSDQIIARVS QSLAKEQSLE SLVRQLLEML EMVTDMESTY LTKVDVEARL QHIMFARNSQ 
KMHIPENFTV SWDYSLCKRA IDENCFFSDE VPDRWGDCIA ARNLGITTFL STPIHLPDGS 
FYGTLCAASS EKRQWSERAE QVLQLFAGLI AQYIQKEALV EQLREANAAL IAQSYTDSLT 
GLPNRRAIFE NLTTLFSLAR HLNHKIMIAF IDLDNFKLIN DRFGHNSGDL FLIQVGERLN 
TLQQNGEVIG RLGGDEFLVV SLNNENADIS SLRERIQQQI RGEYHLGDVD LYYPGASLGI 
VEVDPETTDA DSALHAADIA MYQEKKHKQK TPFVAHPALH S