Gene ECD_00142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00142
Symbol	pcnB
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	160581
End bp	161945
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	56%
IMG OID
Product	poly(A) polymerase I
Protein accession	ACT42043
Protein GI	253976373
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00002208
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTAAGCC GCGAGGAAAG CGAGGCTGAA CAGGCAGTCG CCCGTCCACA GGTGACGGTG 
ATCCCGCGTG AGCAGCATGC TATTTCCCGC AAAGATATCA GTGAAAATGC CCTGAAGGTA 
ATGTACAGGC TCAATAAAGC GGGATACGAA GCCTGGCTGG TTGGCGGCGG CGTGCGCGAC 
CTGTTACTTG GCAAAAAGCC GAAAGACTTT GACGTAACCA CTAACGCCAC GCCTGAGCAG 
GTGCGCAAAC TGTTCCGTAA CTGCCGCCTT GTGGGTCGCC GTTTCCGTCT GGCTCATGTG 
ATGTTTGGCC CGGAGATTAT CGAAGTTGCG ACCTTCCGTG GACACCACGA AGGTAACATC 
AGCGACCGCA CGACCTCCCA ACGCGGGCAA AACGGCATGT TGCTGCGCGA CAACATTTTC 
GGCTCCATCG AAGAAGACGC CCAGCGCCGC GATTTCACTA TCAACAGCCT GTATTACAGC 
GTAGCGGATT TTACCGTCCG TGATTACGTT GGCGGCATGA AGGATCTGAA GGACGGCGTT 
ATCCGTCTGA TTGGTAACCC GGAAACGCGC TACCGTGAAG ATCCGGTACG TATGCTGCGC 
GCGGTACGTT TTGCCGCCAA ATTGGGTATG CGCATCAGCC CGGAAACCGC AGAACCGATC 
CCTCGCCTCG CTACCCTGCT GAACGATATC CCACCGGCAC GCCTGTTTGA AGAATCGCTT 
AAACTGCTAC AAGCGGGCTA CGGTTACGAA ACCTATAAGC TGTTGTGTGA ATATCATCTG 
TTCCAGCCGC TGTTCCCGAC CATTACCCGC TACTTCACGG AAAATGGCGA CAGCCCGATG 
GAGCGGATCA TTGAACAGGT GCTGAAGAAT ACCGATACGC GTATCCATAA CGATATGCGC 
GTGAACCCGG CGTTCCTGTT TGCCGCCATG TTCTGGTACC CACTGCTGGA GACGGCACAG 
AAGATCGCCC AGGAAAGCGG CCTGACCTAT CACGACGCTT TCGCGCTGGC GATGAACGAC 
GTGCTGGACG AAGCCTGCCG TTCACTGGCA ATCCCGAAAC GTCTGACGAC ATTAACCCGC 
GATATCTGGC AGTTGCAGTT GCGTATGTCC CGTCGTCAGG GTAAACGCGC ATGGAAACTG 
CTGGAGCATC CTAAGTTCCG TGCGGCTTAT GACCTGTTGG CCTTGCGAGC TGAAGTTGAG 
CGTAACGCTG AACTGCAGCG TCTGGTGAAA TGGTGGGGTG AGTTCCAGGT TTCCGCGCCA 
CCAGACCAAA AAGGGATGCT CAACGAGCTG GATGAAGAAC CGTCACCGCG TCGTCGTACT 
CGTCGTCCAC GCAAACGCGC ACCGCGTCGT GAGGGTACCG CATGA

Protein sequence

MLSREESEAE QAVARPQVTV IPREQHAISR KDISENALKV MYRLNKAGYE AWLVGGGVRD 
LLLGKKPKDF DVTTNATPEQ VRKLFRNCRL VGRRFRLAHV MFGPEIIEVA TFRGHHEGNI 
SDRTTSQRGQ NGMLLRDNIF GSIEEDAQRR DFTINSLYYS VADFTVRDYV GGMKDLKDGV 
IRLIGNPETR YREDPVRMLR AVRFAAKLGM RISPETAEPI PRLATLLNDI PPARLFEESL 
KLLQAGYGYE TYKLLCEYHL FQPLFPTITR YFTENGDSPM ERIIEQVLKN TDTRIHNDMR 
VNPAFLFAAM FWYPLLETAQ KIAQESGLTY HDAFALAMND VLDEACRSLA IPKRLTTLTR 
DIWQLQLRMS RRQGKRAWKL LEHPKFRAAY DLLALRAEVE RNAELQRLVK WWGEFQVSAP 
PDQKGMLNEL DEEPSPRRRT RRPRKRAPRR EGTA