Gene Sfum_1774 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_1774
Symbol	trpD
ID	4459921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	2168915
End bp	2169928
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	64%
IMG OID	639702543
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_845896
Protein GI	116749209
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCAGG ACGGCATCAA GAAAATCATT CAGAGAGAGG ACCTCTCGGA AACGGAAATG 
TCCGCCGTGA TGAGTGAAAT CATGTCCGGC GAAGCCACGG ACGCCCAGAT CGGTGCATTC 
ATGGGGGCGC TGGCCACCAA GGGCGAGACG TTCGAGGAAC TGGCGGGAGC GGCCCGCACC 
ATGCGACGCA AGGCCGCCCG AATCCAGGTC ACCTCCCCCG TGATCGTGGA TACCTGCGGG 
ACGGGCGGCG ACCGCAAAGG GACCTTCAAT ATCTCGACGA CCGCCGCGTT CGTGGTTGCC 
GGTTGCGGCG TGACGGTCGC CAAGCACGGC AATCGTTCGG TATCGAGCCA ATGCGGCAGC 
GCCGACCTGC TGGAGGCCCT GGGGATGAGA CTGGATGCCC CCGCGGAGGT GGTCGAAGAG 
GCCATCGGCC GCATCGGGAT AGGCTTTCTT TTCGCGCCCC TGTTTCACGG CGCCATGCGC 
CATGCGGCCA GGGCCAGGAA GGAGGTCGGC GTGCGGTCCA TCTTCAACAT GCTGGGACCG 
CTTACCAATC CGGCAGGGGC CAATTGCCAG GTGCTCGGCG TTTATGCACC CCAGTTGACG 
GAAATGTTCG CTCAGGCGCT CCGTTTGCTC GGGGCCAGGC GAGCGTTCGT CGTCCACGGA 
CAGGACGGGC TTGACGAAAT CTCGGTATGC GCCCCCACTC GGGTTTCGGA ACTGGATGGA 
GGGCTGGTAA GGACCTACGA CCTGCAGCCG GAGTTGCTCC TGGGCCGAAA GGCCGACCCC 
GAAGATCTGG CCGGTGGGGA CCCGGGCGTC AACGCGAAGA TCACCAGGGA CGTTCTCGGC 
GGCGCCATCG GCCCGCGGCG CGACGTCGTG GTGCTGAATG CCGCTGCAGC GCTCATTGCG 
GCCGGGGCGG CCGAGGGCTT TCCATCGGCC GTGCGCAATG CCGAGGAGTC GATCGATGGC 
GGGAAAGCCA TCGAAAAGCT GGAAGCCCTG GTCCGTTACA CCAACGAGAA TTGA

Protein sequence

MIQDGIKKII QREDLSETEM SAVMSEIMSG EATDAQIGAF MGALATKGET FEELAGAART 
MRRKAARIQV TSPVIVDTCG TGGDRKGTFN ISTTAAFVVA GCGVTVAKHG NRSVSSQCGS 
ADLLEALGMR LDAPAEVVEE AIGRIGIGFL FAPLFHGAMR HAARARKEVG VRSIFNMLGP 
LTNPAGANCQ VLGVYAPQLT EMFAQALRLL GARRAFVVHG QDGLDEISVC APTRVSELDG 
GLVRTYDLQP ELLLGRKADP EDLAGGDPGV NAKITRDVLG GAIGPRRDVV VLNAAAALIA 
AGAAEGFPSA VRNAEESIDG GKAIEKLEAL VRYTNEN