Gene SbBS512_E1210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1210
Symbol	hisB
ID	6270862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	1116938
End bp	1118005
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	54%
IMG OID	641725341
Product	imidazole glycerol-phosphate dehydratase/histidinol phosphatase
Protein accession	YP_001879855
Protein GI	187733376
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0131] Imidazoleglycerol-phosphate dehydratase [COG0241] Histidinol phosphatase and related phosphatases
TIGRFAM ID	[TIGR01261] histidinol-phosphatase [TIGR01656] histidinol-phosphate phosphatase family domain [TIGR01662] HAD-superfamily hydrolase, subfamily IIIA

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAGA AGTATCTTTT TATCGATCGC GATGGAACCC TGATTAGCGA ACCGCCGAGT 
GATTTTCAGG TGGACCGTTT TGACAAACTC GCCTTTGAAC CAGGCGTGAT CCCGGAACTG 
CTGAAGCTGC AAAAAGCGGG CTATAAACTG GTGATGATCA CCAACCAGGA TGGTCTGGGG 
ACGCAAAGTT TCCCGCAGGC GAATTTCGAT GGCCCGCACA ACCTGATGAT GCAGATCTTC 
ACCTCGCAAG GCGTGCAGTT TGATGAAGTG CTGATTTGCC CGCACCTGCC CGCCGATGAA 
TGCGACTGCC GTAAGCCGAA AGTAAAACTG GTGGAGCGTT ATCTCGCTGA GCAAGCGATG 
GATCGCGCCA ACAGTTATGT GATTGGCGAT CGCGCGACCG ACATTCAACT GGCGGAAAAC 
ATGGGCATTA CTGGTTTACG CTACGACCGC GAAACCCTGA ACTGGCCAAT GATTGGCGAG 
CAACTCACCA GACGTGACCG TTACGCTCAC GTAGTGCGTA ATACCAAAGA GACGCAGATT 
GACGTTCAGG TGTGGCTGGA TCGTGAAGGT GGCAGCAAGA TTAACACCGG CGTTGGCTTC 
TTTGATCATA TGCTGGATCA GATCGCTACC CACGGCGGTT TCCGCATGGA AATCAACGTC 
AAAGGCGACC TCTATATCGA CGATCACCAC ACCGTCGAAG ATACCGGCCT GGCGCTGGGC 
GAAGCGTTAA AAATTGCCCT CGGCGATAAA CGCGGTATTT GTCGCTTTGG TTTTGTGCTA 
CCGATGGACG AATGCCTTGC CCGCTGCGCG CTGGATATCT CTGGTCGCCC GCACCTGGAA 
TATAAAGCCG AGTTTACCTA CCAGCGCGTG GGCGATCTCA GCACCGAGAT GATCGAGCAC 
TTCTTCCGTT CGCTCTCTTA CACCATGGGC GTGACGCTAC ACCTGAAAAC CAAAGGTAAA 
AACGATCACC ACCGTGTAGA GAGCCTGTTC AAAGCCTTTG GTCGCACCCT GCGCCAGGCC 
ATCCGCGTGG AAGGCGACAC CCTGCCCTCG TCGAAAGGAG TGCTGTAA

Protein sequence

MSQKYLFIDR DGTLISEPPS DFQVDRFDKL AFEPGVIPEL LKLQKAGYKL VMITNQDGLG 
TQSFPQANFD GPHNLMMQIF TSQGVQFDEV LICPHLPADE CDCRKPKVKL VERYLAEQAM 
DRANSYVIGD RATDIQLAEN MGITGLRYDR ETLNWPMIGE QLTRRDRYAH VVRNTKETQI 
DVQVWLDREG GSKINTGVGF FDHMLDQIAT HGGFRMEINV KGDLYIDDHH TVEDTGLALG 
EALKIALGDK RGICRFGFVL PMDECLARCA LDISGRPHLE YKAEFTYQRV GDLSTEMIEH 
FFRSLSYTMG VTLHLKTKGK NDHHRVESLF KAFGRTLRQA IRVEGDTLPS SKGVL