Gene EcSMS35_0858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0858
Symbol
ID	6146660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	864657
End bp	867005
Gene Length	2349 bp
Protein Length	782 aa
Translation table	11
GC content	42%
IMG OID	641615746
Product	cyclic diguanylate phosphodiesterase domain-containing protein
Protein accession	YP_001742938
Protein GI	170681940
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAGTT TATACGAAAA GATAAAGATA AGGCTGATAA TTTTATTTTT ATTGGCAGCA 
CTGTCATTTA TTGGTCTTTT TTTCATCATT AACTATCAAC TGGTATCGGA ACGCGCGGTA 
AAACGTGCCG ATAGCCGCTT TGAACTTATT CAGAAAAACG TTGGCTATTT CTTTAAAGAT 
ATTGAACGTT CGGCCCTGAC ATTAAAGGAC TCACTATATT TATTAAAAAA TACAGAGGAG 
ATTCAACGCG CCGTAATTCT GAAAATGGAA ATGATGCCAT TTTTAGACTC GGTGGGACTG 
GTACTTGATG ATAATAAATA TTATCTCTTT TCGCGGAGGA CGAATGATAA AATCGTTGTT 
TATCATCAGG AACAAGTAAA TGGACCGCTT GTCGACGAGT CAGGGCGGGT TATTTTTGCC 
GATTTTAACC CATCGAAACG ACCGTGGTCG GTGGCTTCAG ATGACTCTAA CAACAGCTGG 
TATCCGGCAT ACAATTGCTT TGATCGTCCG GGTAAAAAAT GTATCTCTTT TACGCTACGC 
ATCAACGGCA AAGATCACGA TTTGTTAGCG GTGGATAAAA TACATGTCGA TTTAAACTGG 
CGATATCTGA ACGAGTATCT TGATCACATC AGCGCTAATG ATGAAGTTCT ATTTTTGAAA 
CAAGGCCATG AGATCATTGC CAAGAATCAA CTCGCGCGTG AAAAACTGAT TATTTATAAT 
AGCGAAGGTA ATTATAATAT TATTGATTCT GTCGATACTG AATATATCGA AAAAACATCA 
GTGGTGCCAA ACAACGCATT ATTCGAAATC TATTTTTATT ATCCTGGCGG TAATTTATTG 
AACGCATCAG ATAAACTTTT TTATCTGCCG TTTGCGTTCA TTATTATCGT ATTGTTGGTG 
GTTTATTTAA TGACCACTCG TGTGTTCCGT CGGCAATTTT CTGAAATGAC CGAGCTGGTT 
AATACGCTGG CGTTTTTGCC CGACTCAACG GATCAGATCG AGGCTCTGAA AATTCGCGAA 
GGCGATGCGA AAGAGATTAT CAGCATCAAA AATTCGATCG CGGAAATGAA AGATGCCGAA 
ATTGAACGGT CAAATAAATT GCTCTCACTG ATCTCTTACG ATCAGGAAAG CGGTTTTATT 
AAAAATATGG CGATTATTGA GTCCAACAAT AATCAGTATC TGGCTGTGGG GATCATCAAA 
CTGTGTGGTC TGGAAGCCGT GGAAGCGGTG TTTGGTGTTG ATGAACGCAA TAAAATCGTC 
AGAAAATTGT GTCAGCGAAT TGCCGAGAAA TATGCGCAAT GCTGCGATAT CGTGACATTT 
AATGCCGATC TCTATTTACT CCTGTGCCGG GAAAATGTAC AGACGTTTAC CCGTAAGATA 
GCGACGGTAA ACGATTTTGA CAGCAGTTTT GGCTACCGCA ATCTGCGCAT CCATAAGTCT 
GCTATTTGTG AACCTTTGCA GGGGGAAAAC GCCTGGAGTT ACGCAGAAAA GCTGAAACTG 
GCGATTTCCA GTATCCGCAA CCATATGTTC TCAGAGTTTA TTTTCTGTGA TGATGCGAAA 
CTCAACGAAA TAGAAGAGAA TATCTGGATT GCGCGTAATA TTCGCCATGC AATGGAAATT 
GGCGAACTAT TCCTCGTCTA TCAACCGATC GTTGATATTA ACACCCGCGC CATTCTGGGC 
GCGGAGGCGT TGTGCCGTTG GGTGTCTGCG GAGCGGGGGA TCATTTCACC GCTAAAGTTC 
ATTACCATTG CTGAAGATAT CGGGTTTATC AATGAGCTGG GTTATCAGAT TATTAAAACC 
GCGATGGGTG AATTCAGACA TTTTAGTCAG CGTGCGGTCC TGAAGGACGG TTTCTTACTG 
CATATTAATG TTTCGCCCTG GCAGTTAAAC GAACCACACT TTCATGAGCG TTTTACCACC 
ATCATGGAAG AAAATGGCCT GAAGGTGAAC AGCCTCTGTG TTGAGATCAC TGAAACCGTG 
ATTGAGCGAA TTAATGAACA TTTTTATCTC AATATTGAAC AACTGCGTAA ACAAGGGGTA 
CGGATATCGA TTGATGACTT TGGCACCGGT TTGTCAAACC TGAAACGTTT TTATGAAATT 
AATCCAGATA GCATAAAAGT GGACTCACAA TTTACCGGCG ATATTTTCGG TACTGCGGGA 
AAAATTGTGC GCATTATTTT CGATCTGGCA CGCTATAACC GGATCCCGGT GATTGCGGAA 
GGCGTAGAGA GCGAAGACGT TGCGCGCGAA TTAATCAAAT TAGGATGTGT TCAGGCTCAG 
GGGTATCTGT ACCAGAAACC CATGCCGTTC TCCGCCTGGG ATAAAAGTGG AAAATTAGTA 
AAAGAGTAG

Protein sequence

MLSLYEKIKI RLIILFLLAA LSFIGLFFII NYQLVSERAV KRADSRFELI QKNVGYFFKD 
IERSALTLKD SLYLLKNTEE IQRAVILKME MMPFLDSVGL VLDDNKYYLF SRRTNDKIVV 
YHQEQVNGPL VDESGRVIFA DFNPSKRPWS VASDDSNNSW YPAYNCFDRP GKKCISFTLR 
INGKDHDLLA VDKIHVDLNW RYLNEYLDHI SANDEVLFLK QGHEIIAKNQ LAREKLIIYN 
SEGNYNIIDS VDTEYIEKTS VVPNNALFEI YFYYPGGNLL NASDKLFYLP FAFIIIVLLV 
VYLMTTRVFR RQFSEMTELV NTLAFLPDST DQIEALKIRE GDAKEIISIK NSIAEMKDAE 
IERSNKLLSL ISYDQESGFI KNMAIIESNN NQYLAVGIIK LCGLEAVEAV FGVDERNKIV 
RKLCQRIAEK YAQCCDIVTF NADLYLLLCR ENVQTFTRKI ATVNDFDSSF GYRNLRIHKS 
AICEPLQGEN AWSYAEKLKL AISSIRNHMF SEFIFCDDAK LNEIEENIWI ARNIRHAMEI 
GELFLVYQPI VDINTRAILG AEALCRWVSA ERGIISPLKF ITIAEDIGFI NELGYQIIKT 
AMGEFRHFSQ RAVLKDGFLL HINVSPWQLN EPHFHERFTT IMEENGLKVN SLCVEITETV 
IERINEHFYL NIEQLRKQGV RISIDDFGTG LSNLKRFYEI NPDSIKVDSQ FTGDIFGTAG 
KIVRIIFDLA RYNRIPVIAE GVESEDVARE LIKLGCVQAQ GYLYQKPMPF SAWDKSGKLV 
KE