Gene EcHS_A4467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4467
Symbol	cpdB
ID	5594053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4469775
End bp	4471718
Gene Length	1944 bp
Protein Length	647 aa
Translation table	11
GC content	49%
IMG OID	640923565
Product	bifunctional 2',3'-cyclic nucleotide 2'-phosphodiesterase/3'-nucleotidase periplasmic precursor protein
Protein accession	YP_001461006
Protein GI	157163688
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0737] 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases
TIGRFAM ID	[TIGR01390] 2',3'-cyclic-nucleotide 2'-phosphodiesterase

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAAGT TTAGCGCAAC GCTCCTGGCC ACGCTGATTG CCGCCAGTGT GAATGCAGCG 
ACGGTCGATC TGCGTATCAT GGAAACCACT GATCTGCATA GCAACATGAT GGATTTCGAT 
TATTACAAAG ACACCGCCAC GGAAAAGTTC GGACTGGTAC GCACCGCAAG CCTGATTAAC 
GATGCCCGCA ATGAAGTCAA AAATAGCGTG CTGGTGGATA ACGGCGACTT GATCCAGGGA 
AGTCCGCTGG CCGATTACAT GTCGGCGAAA GGATTAAAAG CCGGAGATAT TCACCCGGTC 
TATAAGGCAT TAAATACGCT GGACTATACC GTCGGCACGC TTGGCAACCA CGAGTTTAAC 
TACGGTCTGG ATTACCTGAA AAATGCGTTG GCAGGAGCGA AATTCCCTTA TGTAAATGCC 
AACGTCATTG ACGCAAAAAC CAAACAGCCC ATGTTTACAC CGTATTTAAT TAAAGACACC 
GAAGTGGTCG ATAAAGACGG AAAAAAACAG ACGTTAAAGA TTGGCTATAT TGGCGTCGTG 
CCGCCGCAGA TTATGGGGTG GGATAAAGCC AATTTGTCCG GCAAAGTCAC CGTTAACGAT 
ATAACAGAAA CTGTGCGCAA ATACGTGCCT GAAATGCGTG AGAAAGGTGC CGATCTCGTT 
GTCGTTCTGG CGCATTCCGG GCTGTCTGCC GATCCGTATA AAGTGATGGC GGAAAACTCA 
GTTTATTATC TCAGTGAAAT TCCGGGTGTT GACGCCATTA TGTTTGGCCA TGCTCACGCC 
GTTTTCCCAA GTAAAGATTT TGCTGATATC GAAGGAGCTG ATATCGCGAA AGGCACGCTG 
AATGGTGTTC CGGCGGTAAT GCCAGGCATG TGGGGCGATC ATCTTGGTGT GGTCGACTTA 
CAACTCAGTA ATGACAGCGG TAAATGGCAG GTGACGCAGG CGAAAGCGGA AGCACGACCG 
ATTTACGACA TCGCTAATAA AAAATCCCTC GCGGCGGAAG ACAGCAAGCT GGTAGAAACA 
CTCAAAGCCG ATCACGATGC CACACGCCAG TTCGTCAGCA AGCCAATCGG TAAATCTGCC 
GACAATATGT ATAGCTATCT GGCACTGGTG CAGGACGATC CGACCGTGCA GGTGGTGAAC 
AACGCGCAAA AAGCGTATGT CGAGCATTAC ATTCAGAGCG ATCCGGATCT GGCAAAACTG 
CCAGTGCTTT CAGCTGCCGC ACCGTTTAAA GTTGGTGGTC GCAAAAATGA CCCGGCAAGC 
TATGTGGAGG TGGAAAAAGG CCAGTTGACC TTCCGTAATG CCGCCGATCT TTATCTCTAC 
CCCAATACGC TGATTGTGGT GAAAGCCAGC GGTAAAGAGG TGAAAGAGTG GCTGGAATGC 
TCTGCCGGAC AGTTTAACCA GATTGATCCT AACAGCACGA AACCACAGTC ACTCATTAAC 
TGGGATGGTT TCCGCACTTA TAACTTTGAT GTGATTGATG GTGTGAATTA TCAGATTGAT 
GTTACCCAAC CCGCCCGTTA TGACGGCGAG TGCCAGATGA TTAATGCCAA TGCGGAAAGG 
ATTAAGAACC TGACCTTTAA CGGCAAGCCG ATTGATCCGA ACGCCATGTT CCTCGTTGCC 
ACCAATAACT ATCGCGCTTA CGGCGGCAAA TTTGCCGGTA CGGGCGACAG CCATATCGCT 
TTTGCTTCAC CGGATGAGAA CCGCTCGGTG CTGGCAGCGT GGATTGCTGA TGAGTCGAAA 
CGTGCGGGGG AAATTCACCC GGCGGCAGAT AACAACTGGC GTTTAGCACC GATAGCCGGC 
GATAAGAAAC TGGATATCCG TTTCGAAACT TCCCCGTCAG ATAAAGCCGC AGCGTTTATT 
AAAGAGAAAG GGCAATATCC GATGAATAAA GTCGCGACCG ATGATATCGG GTTTGCGATT 
TATCAGGTGG ATTTGAGTAA GTAA

Protein sequence

MIKFSATLLA TLIAASVNAA TVDLRIMETT DLHSNMMDFD YYKDTATEKF GLVRTASLIN 
DARNEVKNSV LVDNGDLIQG SPLADYMSAK GLKAGDIHPV YKALNTLDYT VGTLGNHEFN 
YGLDYLKNAL AGAKFPYVNA NVIDAKTKQP MFTPYLIKDT EVVDKDGKKQ TLKIGYIGVV 
PPQIMGWDKA NLSGKVTVND ITETVRKYVP EMREKGADLV VVLAHSGLSA DPYKVMAENS 
VYYLSEIPGV DAIMFGHAHA VFPSKDFADI EGADIAKGTL NGVPAVMPGM WGDHLGVVDL 
QLSNDSGKWQ VTQAKAEARP IYDIANKKSL AAEDSKLVET LKADHDATRQ FVSKPIGKSA 
DNMYSYLALV QDDPTVQVVN NAQKAYVEHY IQSDPDLAKL PVLSAAAPFK VGGRKNDPAS 
YVEVEKGQLT FRNAADLYLY PNTLIVVKAS GKEVKEWLEC SAGQFNQIDP NSTKPQSLIN 
WDGFRTYNFD VIDGVNYQID VTQPARYDGE CQMINANAER IKNLTFNGKP IDPNAMFLVA 
TNNYRAYGGK FAGTGDSHIA FASPDENRSV LAAWIADESK RAGEIHPAAD NNWRLAPIAG 
DKKLDIRFET SPSDKAAAFI KEKGQYPMNK VATDDIGFAI YQVDLSK