Gene EcSMS35_4523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4523
Symbol
ID	6147170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4623059
End bp	4624645
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	45%
IMG OID	641619339
Product	cyclic diguanylate phosphodiesterase domain-containing protein
Protein accession	YP_001746451
Protein GI	170680947
COG category	[T] Signal transduction mechanisms
COG ID	[COG4943] Predicted signal transduction protein containing sensor and EAL domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCATC GTGCACGACA CCAATTACTG GCGTTGCCGG GCATTATCTT TTTAGTTCTC 
TTTCCCATCA TTCTGTCGCT ATGGATTGCC TTCTTTTGGG CAAAATCAGA AGTGAATAAT 
CAGCTCCGAA CCTTTGCTCA GCTGGCGTTG GATAAATCTG AGCTGGTCAT TCGTCAGGCA 
GATTTAGTGA GCGATGCAGC TGAACGCTAT CAGGGGCAAG TTTGCACCCC AGCCCATCAA 
AAGCGAATGT TGAATATTAT TCGTGGCTAT CTTTATATTA ATGAATTGAT CTATGCCCGT 
GATAACCATT TTTTATGCTC ATCGCTGATA GCGCCTGTAA ACGGCTATAC GATTGCACCG 
GCCGATTATA AGCGTGAACC TAACGTTTCT ATCTATTATT ACCGCGATAC GCCTTTTTTC 
TCTGGCTATA AAATGACCTA TATGCAGCGG GGAAATTATG TGGCGGTCAT CAACCCTCTC 
TTCTGGAGTG AAGTGATGTC TGATGATCCG ACATTGCAAT GGGGTGTATA TGATACGGTA 
ACGAAAACCT TTTTCTCGTT AAGCAACGAG GCCTCGGCAG CAACGTTTTC TCCACTGATT 
CATTTGAAGG ATTTAACTGT ACAAAGAAAT GGCTATTTAT ATGCGACAGT TTATTCGACA 
AAACGCCCAA TTGCGGCCAT TGTTGCGACT TCATATCAAC GTCTTATAGC GCATTTTTAT 
AATCATCTTA TTTTTGCGTT ACCCGCCGGT ATTTTGGGGA GTCTTGTTCT GCTATTACTC 
TGGCTACGTA TTCGACAAAA CTATTTGTCT CCCAAACGCA AATTGCAACG CGCCCTCGAA 
AAACATCAAC TTTGCCTTTA TTACCAGCCA ATAATCGATA TCAAAACAGA AAAATGTATC 
GGGGCTGAAG CATTGTTACG TTGGCCTGGT GAGCAGGGGC AAGTAATGAA TCCGGCAGAG 
TTTATTCCGC TGGCAGAAAA GGAGGGGATG ATCGGACAGG TAACTGATTA TGTTATTGAT 
AATGTCTTCC GCGATCTGGG CGCATACCTG GCAACACATG CCGATCGCTA TGTTTCTATT 
AACCTGTCGG CCTCCGATTT TCATACGTCA CGGTTGATAG CGCGAACCAA TCAGAAAACA 
GAGCAATACG CGGTGCGTCC ACAGCAAATT AAATTTGAAG TGACTGAACA TGCATTTCTT 
GATGTCGACA AAATGACACC AATTATTCTG GCTTTCCGCC AGGCTGGTTA CGAAGTGGCA 
ATTGATGATT TTGGTATTGG CTACTCTAAC TTGCATAACC TTAAATCATT GAATGTCGAT 
ATTTTGAAAA TCGATAAATC GTTTGTTGAG ACGCTGACCA CCCATAAAAC CAGTCATTTG 
ATTGCGGAAC ACATCATCGA GCTGGCGCAC AGTCTGGGGT TAAAAACGAT CGCTGAAGGC 
GTCGAAACTG AGGAACAGGT TAACTGGCTG CGCAAACGCG GCGTGCGCTA TTGCCAGGGA 
TGGTTCTTTG CGAAGGCGAT GCCGCCGCAG GTGTTTATGC AATGGATGGA GCAATTACCC 
GCGCGGGAGT TAACGCGCGG GCAATAA

Protein sequence

MSHRARHQLL ALPGIIFLVL FPIILSLWIA FFWAKSEVNN QLRTFAQLAL DKSELVIRQA 
DLVSDAAERY QGQVCTPAHQ KRMLNIIRGY LYINELIYAR DNHFLCSSLI APVNGYTIAP 
ADYKREPNVS IYYYRDTPFF SGYKMTYMQR GNYVAVINPL FWSEVMSDDP TLQWGVYDTV 
TKTFFSLSNE ASAATFSPLI HLKDLTVQRN GYLYATVYST KRPIAAIVAT SYQRLIAHFY 
NHLIFALPAG ILGSLVLLLL WLRIRQNYLS PKRKLQRALE KHQLCLYYQP IIDIKTEKCI 
GAEALLRWPG EQGQVMNPAE FIPLAEKEGM IGQVTDYVID NVFRDLGAYL ATHADRYVSI 
NLSASDFHTS RLIARTNQKT EQYAVRPQQI KFEVTEHAFL DVDKMTPIIL AFRQAGYEVA 
IDDFGIGYSN LHNLKSLNVD ILKIDKSFVE TLTTHKTSHL IAEHIIELAH SLGLKTIAEG 
VETEEQVNWL RKRGVRYCQG WFFAKAMPPQ VFMQWMEQLP ARELTRGQ