Gene BCAH820_3831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCAH820_3831
Symbol	proS2
ID	7188922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus AH820
Kingdom	Bacteria
Replicon accession	NC_011773
Strand	-
Start bp	3668702
End bp	3670402
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	39%
IMG OID	643557242
Product	prolyl-tRNA synthetase
Protein accession	YP_002452781
Protein GI	218904947
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00409] prolyl-tRNA synthetase, family II

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	5.08087e-60
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAAACAAA GTATGGTATT CAGTCCTACA TTACGTGAAG TTCCAGCTGA TGCGGAGATT 
AAGAGTCATC AGTTATTACT TCGTGCAGGT TTTATGCGTC AAAATGCTTC TGGTATTTAT 
AGTTTTCTAC CATTTGGATT AAAAGTACTA CACAAAGTAG AACGTATCGT TCGAGAAGAG 
ATGGAGCGCG CAGGTGCCGT AGAATTATTA ATGCCAGCGA TGCAAGCTGC AGAATTATGG 
CAAGAGTCAG GTCGTTGGTA TTCTTACGGA TCTGAATTAA TGCGTATGAA AGATCGTAAC 
GCTCGTGAAT TTGCATTAGG AGCGACACAT GAAGAAGTAA TTACAGATCT TGTACGTGAT 
GAAGTGAAAT CGTATAAAAA ATTACCGTTA ACATTATATC AAATTCAAAC AAAATTCCGT 
GATGAACAAA GACCTCGTTT CGGTTTATTA CGTGGAAGAG AGTTTCTAAT GAAAGATGCA 
TACTCTTTCC ATGCTACGCA AGAGAGCTTA GATGAAGTGT ACGATCGCTT ATACAAAGCA 
TACTCTAACA TCTTTGCTCG TTGTGGCTTG AATTTCCGTG CGGTTATTGC TGATTCTGGA 
GCAATGGGTG GAAAAGATAC ACATGAATTT ATGGTATTAT CTGATGTTGG TGAAGATACA 
ATTGCATACT CTGATACATC TGATTACGCA GCGAACATCG AAATGGCTCC TGTTGTAGCT 
ACGTATACGA AGAGTGACGA AGCAGAAAAA GAGCTTGAAA AAGTAGCAAC ACCAGACCAA 
AAAGCAATTG AAGAAGTATC TGCATTCTTA AACATCGAAG CTGACAAGTG CATTAAGTCT 
ATGGTATTTA AAGTAGATGA GAAATTAGTA GTGGTACTTG TTCGTGGTGA TCATGAAGTA 
AACGATGTAA AAGTGAAAAA TGTATACGGT GCTTCAGTTG TTGAGCTTGC CTCTCATGAA 
GAAGTAAAAG AATTATTAAA TTGTGAAGTT GGTTCATTAG GACCGATTGG TGTAAATGGT 
GATATCGAAA TTATCGCTGA TCACGCTGTA GCATCAATTG TCAACGGATG TTCAGGAGCG 
AACGAAGAAG GATTCCATTA TGTAAATGTA AATCCAGAAC GTGACTTTAA AGTAAGTCAA 
TATACGGATT TACGCTTCAT TCAAGAAGGA GACCAATCTC CAGACGGAAA CGGGACAATT 
CTTTTCGCAC GCGGAATTGA AGTTGGTCAT GTATTCAAAT TAGGAACTCG TTATAGTGAA 
GCAATGAACG CAACATTCCT AGATGAAAAC GGAAAAACAC AACCACTTAT TATGGGTTGT 
TACGGCATTG GTGTGTCTCG CACAGTGGCA GCAATTGCAG AGCAGTTTAA TGATGAGAAC 
GGTTTAGTTT GGCCAAAAGC TGTAGCACCG TTCCATGTGC ATGTAATTCC AGTGAATATG 
AAATCTGATG CACAACGTGA AATGGGTGAA AACATCTACA ACTCATTACA AGAGCAAGGT 
TATGAAGTAT TACTAGATGA TCGTGCAGAA CGTGCAGGTG TTAAATTTGC TGATGCTGAT 
TTATTCGGCC TTCCAGTTCG CGTGACAGTT GGTAAAAAAG CAGACGAAGG TATTGTAGAA 
GTGAAAGTAC GTGCTACAGG TGAGTCTGAA GAAGTAAAAG TAGAAGAACT TCAAACATAT 
ATTGCTAATA TTTTAAAATA G

Protein sequence

MKQSMVFSPT LREVPADAEI KSHQLLLRAG FMRQNASGIY SFLPFGLKVL HKVERIVREE 
MERAGAVELL MPAMQAAELW QESGRWYSYG SELMRMKDRN AREFALGATH EEVITDLVRD 
EVKSYKKLPL TLYQIQTKFR DEQRPRFGLL RGREFLMKDA YSFHATQESL DEVYDRLYKA 
YSNIFARCGL NFRAVIADSG AMGGKDTHEF MVLSDVGEDT IAYSDTSDYA ANIEMAPVVA 
TYTKSDEAEK ELEKVATPDQ KAIEEVSAFL NIEADKCIKS MVFKVDEKLV VVLVRGDHEV 
NDVKVKNVYG ASVVELASHE EVKELLNCEV GSLGPIGVNG DIEIIADHAV ASIVNGCSGA 
NEEGFHYVNV NPERDFKVSQ YTDLRFIQEG DQSPDGNGTI LFARGIEVGH VFKLGTRYSE 
AMNATFLDEN GKTQPLIMGC YGIGVSRTVA AIAEQFNDEN GLVWPKAVAP FHVHVIPVNM 
KSDAQREMGE NIYNSLQEQG YEVLLDDRAE RAGVKFADAD LFGLPVRVTV GKKADEGIVE 
VKVRATGESE EVKVEELQTY IANILK