Gene BCZK4146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK4146
Symbol	hisS
ID	3024351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	-
Start bp	4252939
End bp	4254210
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	40%
IMG OID	637548360
Product	histidyl-tRNA synthetase
Protein accession	YP_085725
Protein GI	52141104
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0483726
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTATTC AAATCCCACG CGGAACGCAA GATATTCTTC CAGGCACTGT TGAGTTATGG 
CAGTATATCG AAGGGCAAGC ACGCGAAATT TGCCGTCGTT ACAATTATAA AGAAATTCGT 
ACACCAATTT TTGAACACAC TGAGCTATTT TTACGTGGTG TTGGTGATAC GACAGATATC 
GTGCAAAAAG AAATGTACTC ATTCCAAGAT CGTGGAGAGC GTAGTTTAAC ATTACGTCCA 
GAAGGCACGG CACCTGTTGT ACGTTCTTAC GTTGAAAACA AAATGTTCGG TGACGCAACA 
CAACCAACGA AATTATATTA TATCGGACAA ATGTTCCGTT ACGAAAGACC ACAAGCAGGT 
CGCTATCGTC AATTCGTACA ATTCGGTATT GAAGCAATCG GTAGTAACGA TCCTGCAATT 
GATGCGGAAG TAATTGCACT TGCTGTAGAG TTTTACCGAG GCATGGGCTT AAAAAATATT 
AAAGTTGTAT TAAACAGCTT AGGTGATGCA GCGAGCCGTC AAGCGCACCG TGATGCATTA 
ATCGCACACT TTGAGCCACG TATCGGTGAG TTCTGTTCTG ACTGTCAATC TCGTTTAGAA 
AAGAACCCTC TTCGTATTTT AGATTGTAAG AAGGACCGTA ACCATGAATT AATGGGAACA 
GCACCATCTA TTACAGAATA CTTAAACGAA GATTCAGCAG TATACTACGA CAAAGTTCAA 
GAACTATTAA CGATGATGGA TGTTCCATTT GAAAAAGATC CGAACTTAGT ACGTGGTTTA 
GACTACTACC AGCACACTGT TTTTGAAATT ATGAGTGAAG CAGAAGGTTT CGGTGCGATC 
ACTACACTAA GCGGTGGTGG CCGTTATAAC GGACTTGTAC AAGAAATCGG TGGACCAGAA 
ATGCCAGGTA TCGGTTTTGC GATGAGTATT GAACGTTTAA TTATGGCGCT AAAAGCTGAA 
AACATCGAAT TACCAATTGA ACATAGTATC GATTGCTATG TTGTAGCGCT TGGTGAAAAA 
GCAAAAGACC ATGCTGCAAA AGTTGCGTTT GATCTTCGGA AAGCTGGATT AGCAGTTGAA 
AAAGATTATT TAGATCGCAA AATGAAAGCA CAATTTAAAT CAGCAGATCG TCTAAAAGCG 
AAATTCGTAG CTGTACTAGG GGAAGATGAG CTAGATAAAG GCATCATTAA CTTAAAAGAT 
ATGGCAACAG GCGAACAAGA AGAAGTAGCA TTAGATGTGT TTGCTTCATA CGTAGCAGAG 
AAATTAATAT AG

Protein sequence

MSIQIPRGTQ DILPGTVELW QYIEGQAREI CRRYNYKEIR TPIFEHTELF LRGVGDTTDI 
VQKEMYSFQD RGERSLTLRP EGTAPVVRSY VENKMFGDAT QPTKLYYIGQ MFRYERPQAG 
RYRQFVQFGI EAIGSNDPAI DAEVIALAVE FYRGMGLKNI KVVLNSLGDA ASRQAHRDAL 
IAHFEPRIGE FCSDCQSRLE KNPLRILDCK KDRNHELMGT APSITEYLNE DSAVYYDKVQ 
ELLTMMDVPF EKDPNLVRGL DYYQHTVFEI MSEAEGFGAI TTLSGGGRYN GLVQEIGGPE 
MPGIGFAMSI ERLIMALKAE NIELPIEHSI DCYVVALGEK AKDHAAKVAF DLRKAGLAVE 
KDYLDRKMKA QFKSADRLKA KFVAVLGEDE LDKGIINLKD MATGEQEEVA LDVFASYVAE 
KLI