Gene Sama_1944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_1944
Symbol
ID	4604194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	2372250
End bp	2373317
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	55%
IMG OID	639781321
Product	imidazole glycerol-phosphate dehydratase/histidinol phosphatase
Protein accession	YP_927819
Protein GI	119775079
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0131] Imidazoleglycerol-phosphate dehydratase [COG0241] Histidinol phosphatase and related phosphatases
TIGRFAM ID	[TIGR01261] histidinol-phosphatase [TIGR01656] histidinol-phosphate phosphatase family domain [TIGR01662] HAD-superfamily hydrolase, subfamily IIIA

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCAGA AAATGCTTTT TATCGACCGC GATGGCACCC TGATTGAGGA GCCGGTAACA 
GATAAGCAGG TCGACAGTCT CAGCAAGCTG GTGTTTGAAC CAACCGCCAT TCCCGCGCTG 
CTGCGGCTGC AAAAAGCCGG TTACCGCCTG ATTATGGTCA GTAATCAGGA TGGCCTCGGC 
ACCCCATCTT TCCCTCAGGA AGACTTTGAC GCCCCCCACA ACCTGATGAT GCAGGTTTTT 
GAAAGTCAGG GCGTTAAGTT TGATGAGGTG CTGATTTGCC CGCACTTCAA CGATGAAAAC 
TGCAGCTGCC GGAAGCCCAA ACTCGGTCTG GTAAAATCCT TCCTGACCCA AGGTCTGGTG 
GATTTTACCG CCTCAGCAGT GATTGGCGAT CGCGACACCG ATGTCGAACT TGGCAACGCC 
ATGGGCATCA AGAGCTTTAA GTATCAGCGT GAAACCCTCG GCTGGAACGC CATTGCCGAT 
TCGCTGCTCG CCAAAGGCCG CTGCGCCACC GTTGTGCGCA CGACCCGCGA AACCGACATT 
AGGGTCACGG TGGATTTAGA CACCCCGGGC AACAATCAAA TCGACACCGG CATCGGCTTT 
TTTGACCATA TGCTTGATCA AATCGCCACC CACGGTAATT TCAGCCTCAA GCTTAACGTC 
GATGGCGACC TTGAGATTGA CGATCACCAC AGTGTGGAAG ACACAGCATT GGCCTTGGGT 
GATGCCCTGC GTCAGGCCCT TGGAGATAAG CGCGGCATCG GCCGTTTCGG CTTTGCCCTG 
CCGATGGATG AAGCCTCGGG CCAGTGTTTG ATGGATATCT CAGGTCGGCC TTTTATCAAG 
TTTGAGGCGA GCTTTAGCCG CGATAAAGTG GGCGAAATGG CCACCGAAAT GGTGCCGCAC 
TTCTTTCGCT CCTTCGCCGA TGGTCTGCGC TGCACCTTAC ACATCGGCTG CGATGGCGAT 
AACGATCACC ACAAGGTAGA AGCCCTGTTC AAGGTGCTTG GCCGCACCCT ACGCCAGGCC 
ATTGCCATCG AAGGTGATGC CCTGCCATCG TCAAAAGGAG TGCTTTGA

Protein sequence

MPQKMLFIDR DGTLIEEPVT DKQVDSLSKL VFEPTAIPAL LRLQKAGYRL IMVSNQDGLG 
TPSFPQEDFD APHNLMMQVF ESQGVKFDEV LICPHFNDEN CSCRKPKLGL VKSFLTQGLV 
DFTASAVIGD RDTDVELGNA MGIKSFKYQR ETLGWNAIAD SLLAKGRCAT VVRTTRETDI 
RVTVDLDTPG NNQIDTGIGF FDHMLDQIAT HGNFSLKLNV DGDLEIDDHH SVEDTALALG 
DALRQALGDK RGIGRFGFAL PMDEASGQCL MDISGRPFIK FEASFSRDKV GEMATEMVPH 
FFRSFADGLR CTLHIGCDGD NDHHKVEALF KVLGRTLRQA IAIEGDALPS SKGVL