Gene SNSL254_A0201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0201
Symbol	pcnB
ID	6486780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	216025
End bp	217338
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	57%
IMG OID	642735638
Product	poly(A) polymerase I
Protein accession	YP_002039420
Protein GI	194446356
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0617] tRNA nucleotidyltransferase/poly(A) polymerase
TIGRFAM ID	[TIGR01942] poly(A) polymerase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000171206
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATTA TCCCGCGTGA ACAGCACGCT ATCTCCCGCA AAGATATCAG TGAAAATGCC 
CTCAAGGTAC TGTACAGGCT GAACAAAGCG GGCTATGAAG CCTACCTGGT CGGCGGCGGC 
GTCCGCGATC TCCTGCTCGG TAAAAAGCCG AAGGATTTCG ACGTGACCAC CAACGCAACA 
CCGGATCAGG TACGGAAATT ATTCCGCAAT TGCCGTCTGG TGGGGCGTCG TTTCCGCCTG 
GCTCACGTGA TGTTTGGCCC GGAAATTATC GAAGTGGCAA CGTTTCGTGG TCATCATGAA 
GGCAGTGAAA GCGACCGTAC GACCTCCCAG CGTGGGCAAA ACGGTATGCT GCTGCGCGAC 
AACATCTTCG GTTCTATCGA AGAAGATGCC CAGCGCCGCG ATTTCACCAT CAACAGCCTT 
TACTACAGCG TGGCGGATTT TACTGTGCGC GATTACGTCG GCGGGATGCA GGATCTGCAA 
GAAGGCGTGA TTCGCCTGAT CGGCAATCCG GAAACGCGCT ACCGCGAAGA TCCGGTTCGA 
ATGCTGCGCG CCGTGCGTTT CGCTGCGAAG CTCAATATGC GTATCAGCCC TGAAACGGCT 
GAGCCAATCC CGCGTCTGGC AACCTTGCTA AACGACATTC CTCCCGCGCG CCTGTTCGAA 
GAGTCGCTGA AGCTGTTGCA GGCGGGGAAC GGTTATGAAA CCTATCAACA ACTGCGGGAA 
TACCACCTCT TCCAGCCGTT GTTTCCTACC ATTACGCGTT ATTTCACCGA AAACGGCGAC 
AGCGCAATGG AACGCATCAT TGCACAGGTG TTGAAGAATA CGGATAACCG CATCCGTAAC 
GAGATGCGCG TTAACCCGGC GTTTTTGTTT GCCGCCATGT TCTGGTATCC GCTGCTGGAG 
ATGGCGCAAA AAATCGCTCA GGAGAGCGGC CTGGCCTATT ACGATGCTTT CGCGCTGGCC 
ATGAATGACG TGCTGGATGA AGCCTGCCGT TCACTGGCGA TCCCGAAACG CCTTACCACG 
CTGACCCGTG ATATTTGGCA GCTTCAGTTA CGCATGTCCC GTCGTCAGGG CAAACGCGCC 
TGGAAGCTGA TGGAACATCC CAAATTCCGC GCCGCGTTTG ATTTGCTGGA GCTGCGCGCT 
CAGGTGGAAA ATAATACTGA ACTGCAACGT CTGGCGCAGT GGTGGGCCGA GTTTCAGGCT 
TCCGCGCCGC CGGAACAAAA AGGGATGCTC AACGAGCTGG ACGACGATCC TGCTCCACGC 
CGCCGTCGTT CACGTCCGCG CAAACGCGCG CCGCGCCGCG AGGGCACCGT ATGA

Protein sequence

MTIIPREQHA ISRKDISENA LKVLYRLNKA GYEAYLVGGG VRDLLLGKKP KDFDVTTNAT 
PDQVRKLFRN CRLVGRRFRL AHVMFGPEII EVATFRGHHE GSESDRTTSQ RGQNGMLLRD 
NIFGSIEEDA QRRDFTINSL YYSVADFTVR DYVGGMQDLQ EGVIRLIGNP ETRYREDPVR 
MLRAVRFAAK LNMRISPETA EPIPRLATLL NDIPPARLFE ESLKLLQAGN GYETYQQLRE 
YHLFQPLFPT ITRYFTENGD SAMERIIAQV LKNTDNRIRN EMRVNPAFLF AAMFWYPLLE 
MAQKIAQESG LAYYDAFALA MNDVLDEACR SLAIPKRLTT LTRDIWQLQL RMSRRQGKRA 
WKLMEHPKFR AAFDLLELRA QVENNTELQR LAQWWAEFQA SAPPEQKGML NELDDDPAPR 
RRRSRPRKRA PRREGTV