Gene EcSMS35_4692 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4692
Symbol	cpdB
ID	6145344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4790565
End bp	4792508
Gene Length	1944 bp
Protein Length	647 aa
Translation table	11
GC content	49%
IMG OID	641619508
Product	bifunctional 2',3'-cyclic nucleotide 2'-phosphodiesterase/3'-nucleotidase periplasmic precursor protein
Protein accession	YP_001746616
Protein GI	170683745
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0737] 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases
TIGRFAM ID	[TIGR01390] 2',3'-cyclic-nucleotide 2'-phosphodiesterase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAAGT TTAGCGCAAC GCTCCTGGCC ACGCTGATTG CCGCCAGTGT GAATGCAGCG 
ACGGTCGATC TGCGTATCAT GGAAACCACT GATCTGCATA GCAACATGAT GGATTTCGAT 
TATTACAAAG ACACCGCCAC GGAAAAATTC GGACTGGTAC GTACGGCAAG CCTGATTAAT 
GATGCCCGCA ATGAAGTGAA AAACAGCGTA CTGGTCGATA ACGGCGATTT GATTCAGGGG 
AGTCCGCTGG CAGATTACAT GTCGGCGAAA GGATTAAAAG CAGGTGATAT TCACCCGGTC 
TATAAGGCAT TAAATACGCT GGACTATACC GTCGGCACGC TTGGCAACCA TGAGTTTAAC 
TACGGTCTGG ATTACCTGAA AAATGCGCTG GCGGGAGCGA AATTCCCTTA TGTAAATGCC 
AACGTCATTG ACGCCAGAAC CAAACAGCCA ATGTTTACAC CGTATTTAAT TAAAGACACC 
GAAGTGGTCG ATAAAGACGG AAAAAAACAG ACGCTGAAGA TTGGCTATAT TGGCGTCGTA 
CCGCCGCAAA TCATGGGCTG GGATAAAGCT AATTTATCCG GGAAAGTGAC GGTGAATGAT 
ATTACCGAAA CCGTGCGCAA ATACGTGCCT GAAATGCGCG AGAAAGGTGC CGATGTCGTT 
GTCGTTCTGG CGCATTCCGG GCTGTCTGCC GATCCGTATA AAGTGATGGC GGAAAACTCA 
GTTTATTACC TCAGTGAAAT TCCGGGCGTT AACGCCATTA TGTTTGGCCA TGCTCACGCC 
GTTTTCCCGG GTAAAGATTT TGCTGATATC GAAGGAGCTG ATATCGCGAA AGGCACGCTG 
AATGGTGTTC CGGCGGTAAT GCCAGGCATG TGGGGCGATC ATCTTGGTGT GGTCGACTTA 
CAACTCAGTA ATGACAGCGG TAAATGGCAG GTAACACAGG CGAAAGCGGA AGCACGACCG 
ATTTACGACA TCGCTAATAA AAAATCCCTC GCGGCGGAAG ACAGCAAGCT GGTAGAAACA 
CTCAAAGCCG ATCACGATGC CACACGCCAG TTCGTCAGCA AGCCAATCGG TAAATCTGCC 
GACAATATGT ATAGCTATCT GGCACTGGTG CAGGACGATC CGACCGTGCA GGTGGTGAAC 
AACGCGCAAA AAGCGTATGT CGAGCATTAC ATTCAGGGCG ATCCGGATCT GGCAAAACTG 
CCAGTGCTTT CAGCTGCCGC ACCGTTTAAA GTTGGTGGTC GCAAAAATGA CCCGGCAAGC 
TATGTGGAGG TGGAAAAAGG TCAGCTGACT TTCCGTAATG CCGCCGATCT TTATCTCTAC 
CCCAATACGC TGATTGTGGT GAAAGCCAGC GGTAAAGAGG TGAAAGAGTG GCTGGAATGC 
TCTGCCGGAC AGTTTAACCA GATTGATCCT AACAGCACGA AACCACAGTC ACTCATTAAC 
TGGGATGGTT TCCGCACTTA TAACTTTGAT GTGATTGATG GTGTGAATTA TCAGATTGAT 
GTTACCCAGC CCGCCCGTTA TGACGGCGAG TGCCAGATGA TTAATGCCAA TGCGGAAAGG 
ATTAAGAACC TGACCTTTAA CGGCAAGCCG ATTGATCCGA ACGCCATGTT CCTCGTTGCC 
ACCAATAACT ATCGCGCTTA CGGCGGCAAA TTTGCCGGTA CGGGCGACAG CCATATCGCT 
TTTGCTTCAC CGGATGAGAA CCGCTCGGTG CTGGCAGCGT GGATTGCTGA TGAGTCGAAA 
CGTGCGGGGG AAATTCACCC GGCGGCAGAT AACAACTGGC GTTTAGCACC GATAGCCGGC 
GATAAGAAAC TGGATATCCG TTTCGAAACC TCTCCGTCAG ATAAAGCCGC AGCGTTTATT 
AAAGAAAAAG GGCAGTATCC GATGAATAAA GTCGCGACCG ATGATATCGG GTTTGCAATT 
TATCAGGTGG ATCTGAGTAA GTAA

Protein sequence

MIKFSATLLA TLIAASVNAA TVDLRIMETT DLHSNMMDFD YYKDTATEKF GLVRTASLIN 
DARNEVKNSV LVDNGDLIQG SPLADYMSAK GLKAGDIHPV YKALNTLDYT VGTLGNHEFN 
YGLDYLKNAL AGAKFPYVNA NVIDARTKQP MFTPYLIKDT EVVDKDGKKQ TLKIGYIGVV 
PPQIMGWDKA NLSGKVTVND ITETVRKYVP EMREKGADVV VVLAHSGLSA DPYKVMAENS 
VYYLSEIPGV NAIMFGHAHA VFPGKDFADI EGADIAKGTL NGVPAVMPGM WGDHLGVVDL 
QLSNDSGKWQ VTQAKAEARP IYDIANKKSL AAEDSKLVET LKADHDATRQ FVSKPIGKSA 
DNMYSYLALV QDDPTVQVVN NAQKAYVEHY IQGDPDLAKL PVLSAAAPFK VGGRKNDPAS 
YVEVEKGQLT FRNAADLYLY PNTLIVVKAS GKEVKEWLEC SAGQFNQIDP NSTKPQSLIN 
WDGFRTYNFD VIDGVNYQID VTQPARYDGE CQMINANAER IKNLTFNGKP IDPNAMFLVA 
TNNYRAYGGK FAGTGDSHIA FASPDENRSV LAAWIADESK RAGEIHPAAD NNWRLAPIAG 
DKKLDIRFET SPSDKAAAFI KEKGQYPMNK VATDDIGFAI YQVDLSK