Gene ECH74115_5730 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5730
Symbol	cpdB
ID	6969231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	5365285
End bp	5367228
Gene Length	1944 bp
Protein Length	647 aa
Translation table	11
GC content	50%
IMG OID	643389363
Product	bifunctional 2',3'-cyclic nucleotide 2'-phosphodiesterase/3'-nucleotidase periplasmic precursor protein
Protein accession	YP_002273756
Protein GI	209396574
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0737] 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases
TIGRFAM ID	[TIGR01390] 2',3'-cyclic-nucleotide 2'-phosphodiesterase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.122281
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAAGT TTAGCGCAAC GCTCCTGGCC ACGCTGATTG CCGCCAGTGT GAATGCAGCG 
ACGGTCGATC TGCGTATCAT GGAAACCACT GATCTGCATA GCAACATGAT GGATTTCGAT 
TATTACAAAG ACACCGCCAC GGAAAAATTC GGACTGGTAC GTACGGCAAG CCTGATTAAC 
AATGCCCGCA ATGAAGTGAA AAACAGCGTA CTGGTCGATA ACGGCGATTT GATTCAGGGG 
AGTCCGCTGG CCGATTACAT GTCGGCGAAA GGATTAAAAG CAGGTGATAT TCACCCGGTC 
TATAAGGCAT TAAATACGCT GGACTATACC GTCGGAACGC TTGGCAACCA CGAGTTTAAC 
TACGGTCTGG ATTACCTGAA AAATGCGCTG GCAGGAGCGA AATTCCCTTA TGTAAATGCC 
AACGTCATTG ACGCCAGAAC CAAACAGCCA ATGTTTACAC CGTATTTAAT TAAAGACACC 
GAAGTGGTCG ATAAAGACGG AAAAAAACAG ACGCTGAAGA TTGGCTATAT TGGCGTCGTG 
CCGCCGCAAA TCATGGGCTG GGATAAAGCT AATTTATCCG GAAAAGTGAC GGTGAATGAT 
ATTACCGAAA CCGTGCGCAA ATACGAGCCT GAAATGCGCG AGAAAGGTGC CGATGTCGTT 
GTCGTTCTGG CGCATTCCGG GCTGTCTGCC GATCCGTATA AAGTAATGGC GGAAAACTCA 
GTTTATTACC TCAGTGAAAT TCCGGGCGTT AACGCCATTA TGTTTGGCCA TGCTCACGCC 
GTTTTCCCGG GTAAAGATTT TGCTGATATC GAAGGGGCTG ATATCACCAA AGGCACGCTG 
AATGGTGTTC CGGCGGTAAT GCCGGGCATG TGGGGCGATC ATCTTGGGGT GGTCGACTTA 
CAACTCAGTA ATGACAGCGG TAAATGGCAG GTGACGCAGG CGAAAGCGGA AGCACGGCCG 
ATTTACGACA TCGCCAATAA AAAATCCCTC GCGGCGGAAG ACAGCAAGCT GGTAGAAACA 
CTCAAAGCCG ATCACGATGC CACACGCCAG TTCGTCAGCA AGCCAATCGG TAAATCTGCC 
GACAATATGT ATAGCTATCT GGCGCTGGTG CAGGACGATC CGACCGTGCA AGTAGTGAAC 
AACGCGCAAA AAGCGTATGT CGAGCATTAC ATTCAGGGCG ATCCGGATCT GGCAAAACTG 
CCGGTGCTTT CAGCTGCCGC ACCGTTTAAA GTCGGTGGTC GCAAAAATGA CCCGGCAAGC 
TATGTGGAGG TGGAAAAAGG CCAGTTGACC TTCCGTAATG CCGCCGATCT TTATCTCTAT 
CCCAATACGC TGATTGTGGT GAAAGCCAGC GGTAAAGAGG TGAAAGAGTG GCTGGAGTGC 
TCCGCCGGAC AGTTTAACCA GATTGATCCC AACAGCACGA AACCACAGTC ACTCATCAAC 
TGGGATGGTT TCCGCACTTA TAACTTTGAT GTTATTGATG GTGTGAATTA TCAGATTGAT 
GTTACCCAGC CCGCCCGTTA TGACGGCGAG TGCCAGATGA TTAATGCCAA TGCGGAAAGG 
ATTAAGAACC TGACCTTTAA TGGCAAGCCG ATTGATCCGA ACGCTATGTT CCTCGTTGCC 
ACCAATAACT ATCGCGCTTA CGGCGGCAAA TTTGCCGGGA CGGGCGACAG CCATATCGCT 
TTTGCTTCAC CGGATGAGAA CCGCTCGGTG CTGGCAGCGT GGATTGCTGA TGAGTCGAAA 
CGTGCGGGGG AAATTCACCC GGCGGCAGAT AACAACTGGC GTTTAGCACC GATAGCTGCC 
GATAAGAAAC TGGATATCCG TTTCGAAACT TCCCCGTCAG ATAAAGCCGC AGCGTTTATT 
AAAGAGAAAG GGCAGTATCC GATGAATAAA GTCGCGACCG ATGATATCGG GTTTGCGATT 
TATCAGGTGG ATTTGAGTAA GTAA

Protein sequence

MIKFSATLLA TLIAASVNAA TVDLRIMETT DLHSNMMDFD YYKDTATEKF GLVRTASLIN 
NARNEVKNSV LVDNGDLIQG SPLADYMSAK GLKAGDIHPV YKALNTLDYT VGTLGNHEFN 
YGLDYLKNAL AGAKFPYVNA NVIDARTKQP MFTPYLIKDT EVVDKDGKKQ TLKIGYIGVV 
PPQIMGWDKA NLSGKVTVND ITETVRKYEP EMREKGADVV VVLAHSGLSA DPYKVMAENS 
VYYLSEIPGV NAIMFGHAHA VFPGKDFADI EGADITKGTL NGVPAVMPGM WGDHLGVVDL 
QLSNDSGKWQ VTQAKAEARP IYDIANKKSL AAEDSKLVET LKADHDATRQ FVSKPIGKSA 
DNMYSYLALV QDDPTVQVVN NAQKAYVEHY IQGDPDLAKL PVLSAAAPFK VGGRKNDPAS 
YVEVEKGQLT FRNAADLYLY PNTLIVVKAS GKEVKEWLEC SAGQFNQIDP NSTKPQSLIN 
WDGFRTYNFD VIDGVNYQID VTQPARYDGE CQMINANAER IKNLTFNGKP IDPNAMFLVA 
TNNYRAYGGK FAGTGDSHIA FASPDENRSV LAAWIADESK RAGEIHPAAD NNWRLAPIAA 
DKKLDIRFET SPSDKAAAFI KEKGQYPMNK VATDDIGFAI YQVDLSK