Gene Tfu_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tfu_1039
Symbol
ID	3579591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermobifida fusca YX
Kingdom	Bacteria
Replicon accession	NC_007333
Strand	-
Start bp	1217385
End bp	1218431
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	637684734
Product	3-deoxy-D-arabinoheptulosonate-7-phosphate synthase
Protein accession	YP_289100
Protein GI	72161443
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCATCG TTATGGCGCC CGACGCCCCT TCCGACACCA TCGACTCCAT CGTTGACCTC 
GTCGCCTCGG TGGGTGGTGA GGCCTACGTG ACCCGGGGGG TGAGCCGGAC CATCATCGGC 
CTGGTAGGCG ACGTGGAACG GTTCGAGACG CTTAATCTGC GTGCCCTCCC CGGCGTCGCC 
GACATCCTGC GCATCTCCAC TCCCTACAAG CTGGTCAGCC GGGAAAACAC GACTGAGCGG 
TCGGTCGTGC AGGTTGCTGG GGTACCGATC GGCGGCGACC ATATGACACT CATCGCCGGT 
CCCTGCGCGG TGGAAACCCC GGAGCAGACT TTGGAAGCGG CGCTGATGGC GAAGCGTGCG 
GGTGCCGCGC TGCTGCGCGG CGGCGCCTAC AAGCCGCGGA CCTCCCCCTA CGCGTTCCAG 
GGCCTGGGCG AGACCGGTCT GAAGATCCTG TCGGATGTGC GTGCGGAGAC CGGCCTGCCG 
ATTGTGACCG AAGTGGTGGA CGCCTCCGAC GTGGAGCTGG TCGCCTCCTA CGCCGACATG 
CTGCAGATCG GCACCCGCAA CATGCAGAAC TTCGCGCTGC TGCAAGCCGT GGGCGACGCG 
GGCAAGCCGG TGCTGCTCAA ACGCGGGATG AGCAGCACGA TCGAGGAGTG GCTGATGGCC 
GCCGAGTACA TTGCGCAGCG CGGCAACTTG AACATCGTGC TGTGCGAGCG CGGCATCCGC 
ACGTTCGAGA AAGCGACCCG TAACACGCTG GACGTGAGCG CGGTCGCCGT GGCGCAGCGG 
CTGTCGCACC TGCCCGTGGT GGTGGACCCG TCGCATTCGG GCGGCAAGCG GGAACTGGTG 
CTGCCGCTGT CGCGTGCGGC GATCGCGGTG GGCGCGGACG GCCTCATCGT CGACGTGCAC 
CCTGCTCCGG AGACGGCACT GTGCGACGGG CCGCAGGCGC TCACGCACGC AGACTTGGCC 
GAGCTGGCGC ACGTGGTGAC GGCGCTGCCG CCGCTCGTGG GCCGCACGCT CACGCCCAGC 
GTGGCGCAGG TGGGCGCCGG CGTGTAA

Protein sequence

MVIVMAPDAP SDTIDSIVDL VASVGGEAYV TRGVSRTIIG LVGDVERFET LNLRALPGVA 
DILRISTPYK LVSRENTTER SVVQVAGVPI GGDHMTLIAG PCAVETPEQT LEAALMAKRA 
GAALLRGGAY KPRTSPYAFQ GLGETGLKIL SDVRAETGLP IVTEVVDASD VELVASYADM 
LQIGTRNMQN FALLQAVGDA GKPVLLKRGM SSTIEEWLMA AEYIAQRGNL NIVLCERGIR 
TFEKATRNTL DVSAVAVAQR LSHLPVVVDP SHSGGKRELV LPLSRAAIAV GADGLIVDVH 
PAPETALCDG PQALTHADLA ELAHVVTALP PLVGRTLTPS VAQVGAGV