Gene BAS2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS2021
Symbol	argS
ID	2848358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	2024593
End bp	2026281
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	36%
IMG OID	637505271
Product	arginyl-tRNA synthetase
Protein accession	YP_028284
Protein GI	49185032
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0018] Arginyl-tRNA synthetase
TIGRFAM ID	[TIGR00456] arginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000995488
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTATA AAACGCAGTT TGCGGAAAGT TTATCTAATA TTTTTACGAA TGAATTAACG 
CAACAGCAAA TTTTAGATTT AATTGAAACA CCGAAACAAG ATGAATTTGG AGATGCTGCA 
TTTCCGTGTT TTTCACTTGC GAAGCAATAT AAAAAATCAC CAGCTATTAT CGCAAAGGAA 
GTTGCAGAGA AATTAAGTGA TCCGTTTTTT ACGAAAGTAG AGGCTGTTGG TCCTTATGTA 
AATGTATTTT TTAATCGTGA TACAGTAAGT GATGCAGTAT TAAAAACGAT TTTAGCGGAG 
AAAGAAGAGT ACGGTAAAAA TTATTTTGGA TGTGAAAAAA CGGTCGTTAT CGATTATTCC 
TCACCTAATA TCGCGAAACC TTTTTCAATG GGGCATTTAC GTTCTACAAT GATTGGAAAT 
TCATTGAAGC ATATCGCTGA AAAATGTGGG TATGAAGTTG TAGGAATTAA TTATATTGGA 
GACTGGGGAA CACAGTTTGG AAAGTTAATT ACGGCTTATA AAAAATGGGG AAATGAAGCA 
GTAGTGAAAG AGGATCCAAT ACGTGAATTA TTTAAGTTAT ATGTTCAATT TCATGAAGAG 
GTAAAAGACG ACGAAGAATT AGAAGAAGAA GGACGCGCTT GGTTTAAGAA ATTAGAAGAA 
GGTGATGAAG AAGCTGTTGA ACTTTGGAAT TGGTTCCGCC ACGAATCCTT AAAAGAATTT 
TCTCGTATTT ATGAACTTCT CGGTGTGGAA TTTACTAATT TTCAAGGAGA AGCTTTTTAT 
AATAATTTAA TGGAAGACTT TATTGGGATT TTAGAGGAAC ATGATTTACT TGAAGAGTCA 
GAAGGTGCAT TAGTCGTTAA TTTAGAAGAA GAGGGCATGC CACCTTGCTT AATTAGAAAA 
TCAGATGGTG CGACGATTTA CGCAACGCGT GACTTAACGG CAGCTCTATA TCGTCAAAAC 
ACATTTGGTT TTGATAAAGC GTTATACGTA GTTGGCCCAG AACAAAGTTT ACACTTCAAT 
CAATTCTTCA CTGTATTAAA AAAGCTCGGC TACACTTGGG TTGATGGCAT GGAACATGTA 
CCGTTTGGGT TCATTTTAAA AGACGGTAAG AAAATGTCCA CACGTAAAGG AAGAGTTATT 
TTACTTGAAG AAGTACTTGA GGAAGCAATC GAACTTGCAA AACAAAATAT TGAAGAGAAA 
AATCCAAACT TGAAACAGAA AGAAGAAGTA GCAAAGCAAG TCGGCGCTGG CGCAGTCATC 
TTCCACGATT TAAAAAATGA GCGTATGCAC AATATTGAAT TCTCATTAGA AAATATGCTG 
AAATTCGAAG GGGAAACAGG CCCGTACGTA CAATACACAC ATGCACGTGC TTGCTCTATT 
TTAAGAAAAG AAAGTGTAGA ATTTGAAACG TGTACATTTG CATTAAAAGA TGATCATAGC 
TGGAGTGTTG TAAAATTACT CAATAAATTC CCACAAGTAA TTGAAATAGC CTTCAACAAA 
AATGAACCAT CGGTTATTTC GAAATACGTA TTAGATGTAG CGCAATCGTT TAATAAATAT 
TACGGGAATG TGCGTATATT AGAAGAGAGT GAAGAGAAAG ACAGTAGACT GGCATTAGTG 
TATGCTGTGA CGGTTGTATT AAAAGAGGGG TTACGTTTAC TTGGGGTGGA GGCACCTGAG 
GAGATGTAA

Protein sequence

MDYKTQFAES LSNIFTNELT QQQILDLIET PKQDEFGDAA FPCFSLAKQY KKSPAIIAKE 
VAEKLSDPFF TKVEAVGPYV NVFFNRDTVS DAVLKTILAE KEEYGKNYFG CEKTVVIDYS 
SPNIAKPFSM GHLRSTMIGN SLKHIAEKCG YEVVGINYIG DWGTQFGKLI TAYKKWGNEA 
VVKEDPIREL FKLYVQFHEE VKDDEELEEE GRAWFKKLEE GDEEAVELWN WFRHESLKEF 
SRIYELLGVE FTNFQGEAFY NNLMEDFIGI LEEHDLLEES EGALVVNLEE EGMPPCLIRK 
SDGATIYATR DLTAALYRQN TFGFDKALYV VGPEQSLHFN QFFTVLKKLG YTWVDGMEHV 
PFGFILKDGK KMSTRKGRVI LLEEVLEEAI ELAKQNIEEK NPNLKQKEEV AKQVGAGAVI 
FHDLKNERMH NIEFSLENML KFEGETGPYV QYTHARACSI LRKESVEFET CTFALKDDHS 
WSVVKLLNKF PQVIEIAFNK NEPSVISKYV LDVAQSFNKY YGNVRILEES EEKDSRLALV 
YAVTVVLKEG LRLLGVEAPE EM