Gene ECH74115_0152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0152
Symbol	pcnB
ID	6969097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	162032
End bp	163396
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	56%
IMG OID	643384229
Product	poly(A) polymerase I
Protein accession	YP_002268752
Protein GI	209398537
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0617] tRNA nucleotidyltransferase/poly(A) polymerase
TIGRFAM ID	[TIGR01942] poly(A) polymerase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000005693
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTAAGCC GCGAGGAAAG CGAGGCTGAA CAGGCAGTCG CCCGTCCACA GGTGACGGTG 
ATCCCGCGTG AGCAGCATGC TATTTCCCGC AAAGATATCA GTGAAAATGC CCTGAAGGTA 
ATGTACAGGC TCAATAAAGC GGGATACGAA GCCTGGCTGG TTGGCGGCGG CGTGCGCGAC 
CTGTTACTCG GCAAAAAGCC GAAAGATTTT GACGTAACCA CTAACGCCAC GCCTGAGCAG 
GTGCGCAAAC TGTTCCGTAA CTGCCGCCTG GTGGGTCGCC GTTTCCGTCT GGCTCATGTG 
ATGTTTGGCC CGGAGATTAT CGAAGTTGCG ACCTTCCGTG GACACCACGA AGGTAACGTC 
AGCGACCGCA CGACCTCCCA ACGCGGGCAA AACGGCATGT TGCTGCGCGA CAACATTTTC 
GGCTCCATCG AAGAAGACGC CCAGCGCCGC GATTTCACTA TCAACAGCCT GTATTACAGC 
GTAGCGGATT TTACCGTCCG TGATTACGTT GGCGGTATGA AGGATCTGAA GGACGGTGTT 
ATCCGTCTGA TTGGTAACCC GGAAACGCGC TACCGTGAAG ATCCGGTACG TATGCTGCGC 
GCAGTACGTT TTGCCGCCAA ATTGGGTATG CGCATCAGCC CGGAAACCGC AGAACCGATC 
CCTCGCCTCG CTACCCTGCT GAACGATATC CCACCGGCAC GCCTGTTTGA AGAATCGCTT 
AAACTGCTAC AAGCGGGCTA CGGTTACGAA ACCTATAAGC TGTTGTGTGA ATATCATCTG 
TTCCAGCCGC TGTTCCCGAC CATTACCCGC TACTTCACGG AAAATGGCGA CAGCCCGATG 
GAGCGGATCA TTGAACAGGT GCTGAAGAAT ACCGATACGC GTATCCATAA CGATATGCGC 
GTGAACCCGG CGTTCCTGTT TGCCGCCATG TTCTGGTACC CACTGCTGGA GACGGCACAG 
AAGATCGCCC AGGAAAGCGG CCTGACCTAT CACGACGCTT TCGCGCTGGC GATGAACGAC 
GTGCTGGACG AAGCCTGCCG TTCACTGGCA ATCCCGAAAC GTCTGACGAC GTTAACCCGC 
GATATCTGGC AGTTGCAGTT GCGTATGTCC CGACGTCAGG GTAAACGCGC ATGGAAATTG 
CTGGAGCATC CTAAGTTCCG TGCGGCTTAT GACCTGTTGG CCTTGCGAGC TGAAGTTGAG 
CGTAACGCTG AACTGCAGCG TCTGGTGAAA TGGTGGGGTG AGTTCCAGGT TTCCGCGCCA 
CCAGACCAAA AAGGGATGCT CAACGAGCTG GATGAAGAAC CGTCACCGCG TCGTCGTACT 
CGTCGTCCAC GCAAACGCGC ACCACGTCGT GAGGGTACCG CATGA

Protein sequence

MLSREESEAE QAVARPQVTV IPREQHAISR KDISENALKV MYRLNKAGYE AWLVGGGVRD 
LLLGKKPKDF DVTTNATPEQ VRKLFRNCRL VGRRFRLAHV MFGPEIIEVA TFRGHHEGNV 
SDRTTSQRGQ NGMLLRDNIF GSIEEDAQRR DFTINSLYYS VADFTVRDYV GGMKDLKDGV 
IRLIGNPETR YREDPVRMLR AVRFAAKLGM RISPETAEPI PRLATLLNDI PPARLFEESL 
KLLQAGYGYE TYKLLCEYHL FQPLFPTITR YFTENGDSPM ERIIEQVLKN TDTRIHNDMR 
VNPAFLFAAM FWYPLLETAQ KIAQESGLTY HDAFALAMND VLDEACRSLA IPKRLTTLTR 
DIWQLQLRMS RRQGKRAWKL LEHPKFRAAY DLLALRAEVE RNAELQRLVK WWGEFQVSAP 
PDQKGMLNEL DEEPSPRRRT RRPRKRAPRR EGTA