Gene Shew_2200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shew_2200
Symbol
ID	4923114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella loihica PV-4
Kingdom	Bacteria
Replicon accession	NC_009092
Strand	+
Start bp	2560961
End bp	2562031
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	59%
IMG OID	640163785
Product	imidazole glycerol-phosphate dehydratase/histidinol phosphatase
Protein accession	YP_001094325
Protein GI	127513128
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0131] Imidazoleglycerol-phosphate dehydratase [COG0241] Histidinol phosphatase and related phosphatases
TIGRFAM ID	[TIGR01261] histidinol-phosphatase [TIGR01656] histidinol-phosphate phosphatase family domain [TIGR01662] HAD-superfamily hydrolase, subfamily IIIA

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0671818
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAAC AGAAAATCCT CTTTATCGAC CGCGATGGCA CACTGATCGA GGAGCCAGTC 
ACCGACAAGC AGGTCGATAG CCTGGCCAAG CTGGTATTTG AGCCTCAGGT GATCCCCGCA 
CTGCTCAAGC TACAGGGCGC CGGCTACCGC CTGGTGATGG TGAGCAATCA GGACGGCCTT 
GGCACCCCCT CCTTCCCCAA GGATGACTTC GATGCGCCCC AGAATATGAT GATGCAGATC 
TTCAACAGCC AGGGGGTCAA GTTCGATGAT GTGCTCATCT GCCCACACTT TGACGATGAA 
AACTGTAGCT GCCGCAAACC TAAGCTGGGT CTGGTCAAGG CTTACCTCAC CGAGGGCCGG 
GTCGACTTTA CTCAGTCGGC GGTGATCGGC GACAGAGAAA CCGATCTGGG CCTGGCCGAG 
GCGATGGGCA TCACAGGCAT ACAGTACAAT CGCGACACCT TGAACTGGGA CGCCATTGCC 
GAACAACTGC TTGGGGGCAA CCGCGTGGCG ACTGTGGTGC GTACCACCAA GGAGACCGAC 
ATCAAGGTCA CTGTCGATCT CGACAGTCAG CTAAAGAGCA GCATCAATAC CGGCATCGGC 
TTCTTCGACC ACATGCTGGA TCAAATCGCC ACCCACGGTA ACTTCAGGCT AGATGTGAGC 
GTCGATGGCG ATCTGGAAAT CGACGATCAC CACAGCGTCG AAGACACGGC CCTGGCCATT 
GGTGATGCCC TCAGGCAGGC CCTTGGGGAT AAACGCGGCA TCGCCCGCTT CGGCTTTAGC 
ATCCCCATGG ATGAAGCCAG CGCCAGCTGC CTGCTGGATC TCTCCGGTCG CCCCTTCATC 
AAGTTTGAGG GGCAGTTCGA GCGCGAGATG GTCGGCGAGA TGGCCACTGA GATGGTGCCT 
CACTTCTTCC GCTCCCTCGC CGATGGCCTG CGCTGCACCC TGCACCTCTC GACCCAAGGC 
GATAACGATC ACCACAAGGT GGAGAGCCTG TTTAAGGTCT TTGGCCGTAC CCTGCGCCAG 
GCGGTGAAGG TCGAGGGCGA CGCCCTGCCA TCGAGCAAGG GGGTGCTATG A

Protein sequence

MMKQKILFID RDGTLIEEPV TDKQVDSLAK LVFEPQVIPA LLKLQGAGYR LVMVSNQDGL 
GTPSFPKDDF DAPQNMMMQI FNSQGVKFDD VLICPHFDDE NCSCRKPKLG LVKAYLTEGR 
VDFTQSAVIG DRETDLGLAE AMGITGIQYN RDTLNWDAIA EQLLGGNRVA TVVRTTKETD 
IKVTVDLDSQ LKSSINTGIG FFDHMLDQIA THGNFRLDVS VDGDLEIDDH HSVEDTALAI 
GDALRQALGD KRGIARFGFS IPMDEASASC LLDLSGRPFI KFEGQFEREM VGEMATEMVP 
HFFRSLADGL RCTLHLSTQG DNDHHKVESL FKVFGRTLRQ AVKVEGDALP SSKGVL