Gene BAS4298 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4298
Symbol	hisS
ID	2850534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4209867
End bp	4211138
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	40%
IMG OID	637507534
Product	histidyl-tRNA synthetase
Protein accession	YP_030546
Protein GI	49187294
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.408041
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTATTC AAATCCCACG CGGAACGCAA GATATTCTTC CAGGCACTGT TGAGTTATGG 
CAGTATATCG AAGGGCAAGC ACGCGAAATT TGCCGTCGTT ACAATTATAA AGAAATTCGT 
ACACCGATCT TTGAACACAC TGAGTTATTT TTACGTGGTG TTGGTGATAC GACAGATATC 
GTGCAAAAAG AAATGTACTC ATTCCAAGAT CGTGGAGAGC GTAGTTTAAC ATTACGTCCA 
GAAGGCACTG CACCTGTTGT ACGTTCTTAC GTTGAAAACA AAATGTTCGG TGACGCAACA 
CAACCAACGA AATTATATTA TATCGGTCAA ATGTTCCGTT ATGAAAGACC ACAAGCAGGT 
CGCTATCGTC AATTCGTACA ATTCGGTATT GAAGCAATCG GTAGTAACGA TCCTGCAATT 
GATGCGGAAG TAATTGCACT TGCTGTAGAG TTTTACCGCG GCATGGGCTT AAAAAATATT 
AAAGTTGTAT TAAACAGCTT AGGTGATGCG GCGAGCCGTC AAGCGCACCG TGATGCGTTA 
ATTGCACACT TTGAGCCACG TATCGGTGAG TTCTGTTCTG ACTGTCAATC TCGTTTAGAA 
AAGAACCCTC TTCGTATTTT AGATTGTAAG AAGGACCGTA ACCATGAATT AATGGGAACA 
GCACCATCTA TTACAGAATA CTTAAACGAA GATTCAGCAG TATACTACGA CAAAGTTCAA 
GAACTATTAA CGATGATGGA TGTTCCATTT GAAAAAGATC CGAACTTAGT ACGTGGTTTA 
GACTACTACC AGCACACTGT TTTTGAAATT ATGAGTGAAG CAGAAGGTTT CGGTGCGATC 
ACTACACTAA GCGGTGGTGG CCGTTATAAC GGACTTGTAC AAGAAATCGG TGGACCAGAA 
ATGCCAGGTA TCGGTTTTGC GATGAGTATT GAACGTTTAA TTATGGCGCT AAAAGCTGAA 
AACATCGAAT TACCAATTGA ACATAGTATC GATTGTTACG TTGTAGCGCT TGGTGAAAAA 
GCGAAAGACC ATGCTGCAAA AGTTGCGTTT GATCTTCGTA AAGCTGGATT AGCAGTTGAA 
AAAGATTATT TAGATCGCAA AATGAAAGCA CAATTTAAAT CAGCAGATCG TCTAAAAGCG 
AAATTCGTAG CTGTACTAGG GGAAGATGAG TTAGATAAAG GCATCATTAA CTTAAAAGAT 
ATGGCAACAG GCGAACAAGA AGAAGTAGCA TTAGATGTGT TTGCTTCATA CGTAGCAGAG 
AAATTAATAT AG

Protein sequence

MSIQIPRGTQ DILPGTVELW QYIEGQAREI CRRYNYKEIR TPIFEHTELF LRGVGDTTDI 
VQKEMYSFQD RGERSLTLRP EGTAPVVRSY VENKMFGDAT QPTKLYYIGQ MFRYERPQAG 
RYRQFVQFGI EAIGSNDPAI DAEVIALAVE FYRGMGLKNI KVVLNSLGDA ASRQAHRDAL 
IAHFEPRIGE FCSDCQSRLE KNPLRILDCK KDRNHELMGT APSITEYLNE DSAVYYDKVQ 
ELLTMMDVPF EKDPNLVRGL DYYQHTVFEI MSEAEGFGAI TTLSGGGRYN GLVQEIGGPE 
MPGIGFAMSI ERLIMALKAE NIELPIEHSI DCYVVALGEK AKDHAAKVAF DLRKAGLAVE 
KDYLDRKMKA QFKSADRLKA KFVAVLGEDE LDKGIINLKD MATGEQEEVA LDVFASYVAE 
KLI