Gene SO_2071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SO_2071
Symbol	hisB
ID	1169816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella oneidensis MR-1
Kingdom	Bacteria
Replicon accession	NC_004347
Strand	-
Start bp	2167220
End bp	2168311
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	51%
IMG OID	637343938
Product	imidazole glycerol-phosphate dehydratase/histidinol phosphatase
Protein accession	NP_717674
Protein GI	24373631
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0131] Imidazoleglycerol-phosphate dehydratase [COG0241] Histidinol phosphatase and related phosphatases
TIGRFAM ID	[TIGR01261] histidinol-phosphatase [TIGR01656] histidinol-phosphate phosphatase family domain [TIGR01662] HAD-superfamily hydrolase, subfamily IIIA

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCAG TATTTACCCC TAATGTCGCG CAAAAAATAC TTTTTATCGA TCGCGATGGC 
ACCTTGATTG AAGAGCCGGT TACAGATAAG CAAGTCGATA ACCTTGCCAA GCTGGTATTC 
GAGCCCCAAG TGATCCCCGC CTTACTGCGC CTGCAAAAAG CCGGTTTTCG TTTGGTGATG 
GTCAGCAATC AGGATGGACT CGGTACCCCG TCCTTCCCGC AGGAAGATTT CGATGCGCCG 
CACAATATGA TGATGCAAAT CCTCTCCAGC CAAGGGGTTA AGTTTGAAGA TGTGCTAATT 
TGCCCACACT TTAACGATGA GAATTGTAGC TGCCGCAAAC CCAAGCTGGG ACTGGTGAAA 
GACTTTTTGA CCCAAGGCTT TATCGATTTT ACCCAGTCCG CGGTGATTGG TGACAGACAC 
ACAGATGTGG AACTGGGCAA TGCCATGGGG ATTATCAGCT TTCAATATCA GCGAGGCAGT 
CTAGGTTGGA ACGCCATTGC CGATGCATTA CTCAACAAGG GCCGCAGCGC GACTGTGGTG 
CGTACCACCA AGGAAACCGA TATTCGCGTG ACAGTCGATC TCGACAATGC CAGCAAAGGC 
ACGATTAACA CTGGCATTGG CTTTTTCGAC CATATGCTGG ATCAAATCGC CACCCACGGG 
AATTTCAAAA TGGAGGTGAA TGTCGATGGA GATCTCGAGA TAGACGATCA CCACAGCGTT 
GAAGATACCG CATTGGCGAT TGGGGATGCA CTGCGCCAAG CGCTTGGCGA TAAACGCGGT 
ATTGCCCGTT TTGGTTTTAG TTTGCCTATG GATGAGGCCA AGGGCGAATG CTTACTCGAT 
CTTTCCGGCA GGCCTTTTAT TAAATTTGCT GCCCAATTTG AACGGGAAAA AGTCGGTGAA 
ATGGCCACCG AAATGGTGCC GCACTTTTTC CGCTCCTTTG CCGATGGTTT GCGCTGCACC 
CTGCATGTGG CCGCCGAGGG AGACAACGAT CACCACAAGG TAGAAGCACT CTTTAAGGTG 
CTGGGCCGCG CACTGCGTCA AGCAGTAAAA GTGGAAGGTG ATGTATTGCC CTCGAGTAAA 
GGCGTTCTCT AA

Protein sequence

MNPVFTPNVA QKILFIDRDG TLIEEPVTDK QVDNLAKLVF EPQVIPALLR LQKAGFRLVM 
VSNQDGLGTP SFPQEDFDAP HNMMMQILSS QGVKFEDVLI CPHFNDENCS CRKPKLGLVK 
DFLTQGFIDF TQSAVIGDRH TDVELGNAMG IISFQYQRGS LGWNAIADAL LNKGRSATVV 
RTTKETDIRV TVDLDNASKG TINTGIGFFD HMLDQIATHG NFKMEVNVDG DLEIDDHHSV 
EDTALAIGDA LRQALGDKRG IARFGFSLPM DEAKGECLLD LSGRPFIKFA AQFEREKVGE 
MATEMVPHFF RSFADGLRCT LHVAAEGDND HHKVEALFKV LGRALRQAVK VEGDVLPSSK 
GVL