Gene Sfum_3766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_3766
Symbol
ID	4457899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	+
Start bp	4608330
End bp	4609343
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	62%
IMG OID	639704539
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_847870
Protein GI	116751183
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00164257
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCATCG TATTGAAACC CGACCACAAG GAAAGCGATC TGCACCGCAT CGTCCGGCGC 
CTCGAGGACC TCGGCCTCGG CGCCCACATC TCCAAGGGAG AGCACAGGAC CATCATCGGG 
GCCATCGGAG ACGAGAGGGT CCTTCGGGAG GTCCCGATGG AATCCTTTCC CGGCGTGGAG 
TCGGTTCTTC CCATTCTGAA ACCCTACAAA CTGGTCAGCA GGGAATTCAA GGAAGAAAAC 
ACGATCGTAC AGGTCAACGG CCATCAAATA GGGGGTGACG AGATCCAGGT CATCGCGGGA 
CCCTGTGCGG TGGAAAGCCG GGAAGTGCTC GAAGAGATCG CCGGCGAGCT CACCGCGGCG 
GGAGTCCATT TTCTCCGCGG CGGCGCCTTC AAGCCGCGCA CGTCTCCTTA CAGCTTTCAG 
GGGTGGGGGG AGAAGGGGCT GAAGCTCCTG GCCGGCGTGC GCGAGCGGAC CGGAATGATG 
ATCGTCACCG AGCTCATGGA TCCCAGAGAT ACGGTGCTGC TCTGCAAGTA CGCGGACATC 
ATCCAGATCG GCACCAGGAA CATGGCCAAT TTCCGGCTGC TCACCGAGGT GGGAAACATC 
GACAAACCGG TGATCCTGAA ACGGGGCATG AGCGCCACGA TCAAGGAGTT CCTCATGTCG 
GCCGAATACA TCGCGGCCCA GGGGAACGAA AAGGTCATCC TCTGTGAAAG GGGAATTCGC 
ACGTTCGAAA CCGAGACCCG CAATACGCTC GACATCAGCG CGGTCCCGCT GCTCAAGAAC 
CTGACCCACC TGCCGGTGAT CGTCGATCCG AGCCATGCCG TGGGGCGAGC GGACCTCGTT 
CCCGCCATGG CCAGAGCGTC CGTGGCAGCG GGCGCGGATG GACTGCTCGT CGAAGTCCAC 
GTGCGGCCCG AGGAGGCGCT GAGCGATGGT CCGCAGTCGC TGCGTCCCGA AGCGTTTGCG 
GTAATGATGG AAGAGTGCCG CAGGGTCGCG GTCGCCATCG GCCGAACGAT GTAA

Protein sequence

MIIVLKPDHK ESDLHRIVRR LEDLGLGAHI SKGEHRTIIG AIGDERVLRE VPMESFPGVE 
SVLPILKPYK LVSREFKEEN TIVQVNGHQI GGDEIQVIAG PCAVESREVL EEIAGELTAA 
GVHFLRGGAF KPRTSPYSFQ GWGEKGLKLL AGVRERTGMM IVTELMDPRD TVLLCKYADI 
IQIGTRNMAN FRLLTEVGNI DKPVILKRGM SATIKEFLMS AEYIAAQGNE KVILCERGIR 
TFETETRNTL DISAVPLLKN LTHLPVIVDP SHAVGRADLV PAMARASVAA GADGLLVEVH 
VRPEEALSDG PQSLRPEAFA VMMEECRRVA VAIGRTM