Gene SbBS512_E0188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0188
Symbol	proS
ID	6269575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	203933
End bp	205651
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	54%
IMG OID	641724439
Product	prolyl-tRNA synthetase
Protein accession	YP_001878997
Protein GI	187730943
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00409] prolyl-tRNA synthetase, family II

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.638995
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTACTA GCCAATACCT GCTCTCCACT CTCAAGGAGA CACCTGCCGA CGCCGAGGTG 
ATCAGCCATC AGCTGATGCT GCGCGCCGGG ATGATCCGCA AGCTGGCCTC CGGGTTATAT 
ACCTGGCTGC CGACCGGCGT GCGCGTTCTG AAAAAAGTCG AAAACATCGT GCGTGAAGAG 
ATGAACAACG CCGGTGCAAT CGAGGTGTCG ATGCCGGTGG TTCAGCCAGC CGATTTGTGG 
CAAGAGAGTG GTCGTTGGGA ACAGTACGGT CCGGAACTGC TGCGTTTTGT TGACCGTGGC 
GAGCGTCCGT TCGTACTCGG CCCAACTCAT GAAGAAGTTA TCACTGACCT GATTCGTAAC 
GAGCTTAGCT CTTACAAACA GCTGCCGCTG AACTTCTATC AGATCCAGAC CAAGTTCCGC 
GACGAAGTGC GTCCGCGTTT CGGCGTCATG CGTTCCCGCG AATTCCTGAT GAAAGATGCT 
TACTCTTTCC ATACTTCTCA GGAATCCCTG CAGGAAACCT ACGATGCAAT GTATGCGGCC 
TACAGCAAAA TCTTCAGCCG CATGGGGCTG GATTTCCGCG CCGTGCAAGC CGACACCGGT 
TCTATCGGCG GCAGCGCCTC TCACGAATTC CAGGTGCTGG CGCAGAGCGG TGAAGACGAT 
GTGGTCTTCT CCGACACCTC TGACTATGCA GCGAACATTG AACTGGCAGA AGCTATCGCG 
CCGAAAGAAC CGCGCGCTGC TGCTACCCAG GAAATGACGC TGGTTGATAC GCCGAACGCG 
AAAACCATCG CGGAACTGGT TGAACAGTTC AATCTGCCGA TTGAGAAAAC GGTTAAGACT 
CTGCTGGTTA AAGCGGTTGA AGGCAGCAGC TTCCCGCTGG TTGCGCTGCT GGTGCGCGGT 
GATCACGAGC TGAACGAAGT TAAAGCAGAA AAACTGCCGC AGGTTGCAAG CCCGCTGACT 
TTCGCGACCG AAGAAGAAAT TCGTGCTGTG GTTAAAGCCG GTCCGGGTTC ACTGGGTCCG 
GTAAACATGC CGATTCCGGT GGTGATTGAC CGTACCGTTG CGGCGATGAG TGATTTCGCT 
GCTGGTGCTA ACATCGATGG TAAACACTAC TTCGGTATCA ACTGGGATCG CGATGTCGCT 
ACCCCGGAAG TTGCAGATAT CCGTAACGTG GTGGCTGGCG ATCCAAGCCC GGATGGCCAG 
GGTACGCTGC TGATCAAACG TGGTATCGAA GTTGGTCACA TCTTCCAGCT GGGTACCAAG 
TACTCCGAAG CACTGAAAGC CTCCGTACAG GGTGAAGATG GCCGTAACCA AATCCTGACG 
ATGGGTTGCT ACGGTATCGG GGTAACGCGT GTGGTAGCTG CGGCGATTGA GCAGAACTAC 
GACGAACGCG GCATCGTATG GCCTGACGCT ATCGCGCCGT TCCAGGTGGC GATTCTGCCG 
ATGAACATGC ACAAATCCTT CCGCGTACAA GAGCTTGCTG AGAAACTGTA CAGCGAACTG 
CGTGCACAAG GTATCGAAGT GCTGCTGGAT GACCGCAAAG AGCGTCCGGG CGTGATGTTT 
GCTGATATGG AACTGATCGG TATTCCGCAC ACTATTGTGC TGGGCGACCG TAACCTCGAC 
AACGACGATA TCGAATATAA ATATCGTCGC AACGGCGAGA AACAGTTAAT TAAGACTGGT 
GACATCGTCG AATATCTGGT GAAACAGATT AAAGGCTGA

Protein sequence

MRTSQYLLST LKETPADAEV ISHQLMLRAG MIRKLASGLY TWLPTGVRVL KKVENIVREE 
MNNAGAIEVS MPVVQPADLW QESGRWEQYG PELLRFVDRG ERPFVLGPTH EEVITDLIRN 
ELSSYKQLPL NFYQIQTKFR DEVRPRFGVM RSREFLMKDA YSFHTSQESL QETYDAMYAA 
YSKIFSRMGL DFRAVQADTG SIGGSASHEF QVLAQSGEDD VVFSDTSDYA ANIELAEAIA 
PKEPRAAATQ EMTLVDTPNA KTIAELVEQF NLPIEKTVKT LLVKAVEGSS FPLVALLVRG 
DHELNEVKAE KLPQVASPLT FATEEEIRAV VKAGPGSLGP VNMPIPVVID RTVAAMSDFA 
AGANIDGKHY FGINWDRDVA TPEVADIRNV VAGDPSPDGQ GTLLIKRGIE VGHIFQLGTK 
YSEALKASVQ GEDGRNQILT MGCYGIGVTR VVAAAIEQNY DERGIVWPDA IAPFQVAILP 
MNMHKSFRVQ ELAEKLYSEL RAQGIEVLLD DRKERPGVMF ADMELIGIPH TIVLGDRNLD 
NDDIEYKYRR NGEKQLIKTG DIVEYLVKQI KG