Gene EcHS_A0146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0146
Symbol	pcnB
ID	5592251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	156777
End bp	158141
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	56%
IMG OID	640919332
Product	poly(A) polymerase I
Protein accession	YP_001456927
Protein GI	157159609
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0617] tRNA nucleotidyltransferase/poly(A) polymerase
TIGRFAM ID	[TIGR01942] poly(A) polymerase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	4.2681200000000003e-19
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTAAGCC GCGAGGAAAG CGAGGCTGAA CAGGCAGTCG CCCGTCCACA GGTGACGGTG 
ATCCCGCGTG AGCAGCATGC TATTTCCCGC AAAGATATCA GTGAAAATGC CCTGAAGGTA 
ATGTACAGGC TCAACAAAGC GGGATACGAA GCCTGGCTGG TTGGCGGCGG CGTGCGCGAC 
CTGTTACTTG GCAAAAAGCC GAAAGATTTT GACGTAACCA CTAACGCCAC GCCTGAGCAG 
GTGCGCAAAC TGTTCCGTAA CTGCCGCCTG GTGGGTCGCC GTTTCCGTCT GGCTCATGTA 
ATGTTTGGCC CGGAGATTAT CGAAGTTGCG ACCTTCCGTG GACACCACGA AGGTAACGTC 
AGCGACCGCA CGACCTCCCA ACGCGGGCAA AACGGCATGT TGCTGCGCGA CAACATTTTC 
GGCTCCATCG AAGAAGACGC CCAGCGCCGC GATTTCACTA TCAACAGCCT GTATTACAGC 
GTAGCGGATT TTACCGTCCG TGATTACGTT GGCGGTATGA AGGATCTGAA GGACGGCGTT 
ATCCGTCTGA TTGGTAACCC GGAAACGCGC TACCGTGAAG ATCCGGTACG TATGCTGCGC 
GCGGTACGTT TTGCCGCCAA ATTGGGTATG CGCATCAGCC CGGAAACCGC AGAACCGATC 
CCTCGCCTCG CTACCCTGTT GAACGATATC CCACCGGCAC GCCTGTTTGA AGAATCGCTT 
AAACTGCTAC AAGCGGGCTA CGGTTACGAT ACCTATAAGC TGTTGTGTGA ATATCATCTG 
TTCCAGCCGC TGTTCCCGAC CATTACCCGC TACTTCACGG AAAATGGCGA CAGCCCGATG 
GAGCGGATCA TTGAACAGGT GCTGAAGAAT ACCGATACGC GTATCCATAA CGATATGCGC 
GTGAACCCGG CGTTCCTGTT TGCCGCCATG TTCTGGTACC CACTGCTGGA GACGGCACAG 
AAGATTGCCC AGGAAAGCGG CCTGACCTAT CACGACGCTT TCGCGCTGGC GATGAACGAC 
GTGCTGGACG AAGCCTGCCG TTCACTGGCA ATCCCGAAAC GTCTGACGAC GTTAACCCGC 
GATATCTGGC AGTTGCAGTT GCGTATGTCC CGTCGTCAGG GTAAACGCGC ATGGAAACTG 
CTGGAGCATC CTAAGTTCCG TGCGGCTTAT GACCTGTTGG CCTTGCGAGC TGAAGTTGAA 
CGTAACGCTG AACTGCAGCG TCTGGTGAAA TGGTGGGGTG AGTTCCAGGT TTCCGCGCCA 
CCAGATCAAA AAGGGATGCT TAACGAGTTG GATGAAGAGC CGTCACCGCG TCGCCGTACT 
CGTCGTCCAC GCAAACGCGC ACCGCGTCGT GAGGGTACCG CATGA

Protein sequence

MLSREESEAE QAVARPQVTV IPREQHAISR KDISENALKV MYRLNKAGYE AWLVGGGVRD 
LLLGKKPKDF DVTTNATPEQ VRKLFRNCRL VGRRFRLAHV MFGPEIIEVA TFRGHHEGNV 
SDRTTSQRGQ NGMLLRDNIF GSIEEDAQRR DFTINSLYYS VADFTVRDYV GGMKDLKDGV 
IRLIGNPETR YREDPVRMLR AVRFAAKLGM RISPETAEPI PRLATLLNDI PPARLFEESL 
KLLQAGYGYD TYKLLCEYHL FQPLFPTITR YFTENGDSPM ERIIEQVLKN TDTRIHNDMR 
VNPAFLFAAM FWYPLLETAQ KIAQESGLTY HDAFALAMND VLDEACRSLA IPKRLTTLTR 
DIWQLQLRMS RRQGKRAWKL LEHPKFRAAY DLLALRAEVE RNAELQRLVK WWGEFQVSAP 
PDQKGMLNEL DEEPSPRRRT RRPRKRAPRR EGTA