Gene Dfer_2106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dfer_2106
Symbol
ID	8225678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dyadobacter fermentans DSM 18053
Kingdom	Bacteria
Replicon accession	NC_013037
Strand	+
Start bp	2571077
End bp	2572234
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	56%
IMG OID	644929943
Product	homogentisate 12-dioxygenase
Protein accession	YP_003086494
Protein GI	255035873
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0415029
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.565208
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATCT ATCAAAAACT AGGAACCATC CCGCCCAAGC GCCACACGCA GTTCCGAAAA 
CCGGACGGCG GGCTTTACTA TGAAGAACTC TTTGGAACGA TCGGTTTCGA AGGCATGTCT 
TCCCTCCTCT ATCACACCTG GCGGCCCACG CAGGTGAAAT CGCTTGGCGA GCCCATTGAC 
ATTTCCCCGC GCGTGGCTGT GACCAACAAT ATGATGATGC GAAAGCTGAT CGGCTTCGAC 
ATGAAACCGG CGGCGGATTA TCTCGACAGC CGAACGCCGT TACTCATGAA CCGCGATCTT 
ATTCTCGGCC TGGCCGCCCC CAGCGGTGCT CCGATGGATT ATTTTTACAA AAATGCCGAC 
GCCGACGAGC TCCTGTTCGT ACACCGCGGC TCGGGCAGGC TGCGCACGCC GTTCGGGCAG 
GTGCCATTCA CATATGGAGA TTATGTACTG ATTCCCAGGG GTACAATTTA CCAGATCGAC 
TTCGATGGGC CTGATAACCG CCTGCTTTAC CTCGAATCAC ATTCGCCCAT TTACACGCCC 
AAACGCTACC GCAACCATTT CGGTCAGCTC ACCGAGCATT CGCCGTATTG CGAGCGTGAT 
TATGTGCTGC CCCGAGACCT CGAAACACAC GACGAGCACG GGGATTTTGT CGTTAAAATC 
AAGAAACAGA GCCATTTTCA CCCGGTCACC TACGAAACGC ACCCGTTTGA TGTCATCGGC 
TGGGACGGAT ACAATTATCC GTGGGCGTTT TCGATCCATA ATTTCGAACC GATTACCGGC 
CGCATTCACC AGCCGCCGCC CGTGCACCAG ACGTTCCAGA CCGACGCATT TGTAGTATGC 
TCGTTTTGCC CGCGGCTTTA CGATTACCAC CCGCTGGCCA TTCCTGCACC CTACAACCAC 
AGCAATATCG ACTCCGACGA GGTCCTGTAC TACGTCGACG GCGACTTCAT GAGCCGCAAC 
GACATCGCGC AGGGGCACAT TACGCTCCAC CCGGGCGGCA TCCCGCACGG TCCGCACCCA 
GGCGCCTACG AACGGAGCAT CGGCAAAAAA GAGACCCAAG AACTCGCCGT CATGGTCGAC 
ACTTTCCGCC CACTCATGCT CACCGAACAG GCAATGGCGA TTGACGACGG GCGGTACTTT 
ATGAGTTGGG GGGAATGA

Protein sequence

MPIYQKLGTI PPKRHTQFRK PDGGLYYEEL FGTIGFEGMS SLLYHTWRPT QVKSLGEPID 
ISPRVAVTNN MMMRKLIGFD MKPAADYLDS RTPLLMNRDL ILGLAAPSGA PMDYFYKNAD 
ADELLFVHRG SGRLRTPFGQ VPFTYGDYVL IPRGTIYQID FDGPDNRLLY LESHSPIYTP 
KRYRNHFGQL TEHSPYCERD YVLPRDLETH DEHGDFVVKI KKQSHFHPVT YETHPFDVIG 
WDGYNYPWAF SIHNFEPITG RIHQPPPVHQ TFQTDAFVVC SFCPRLYDYH PLAIPAPYNH 
SNIDSDEVLY YVDGDFMSRN DIAQGHITLH PGGIPHGPHP GAYERSIGKK ETQELAVMVD 
TFRPLMLTEQ AMAIDDGRYF MSWGE