Gene Xaut_3333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Xaut_3333
Symbol
ID	5422759
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Xanthobacter autotrophicus Py2
Kingdom	Bacteria
Replicon accession	NC_009720
Strand	-
Start bp	3707547
End bp	3708914
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	67%
IMG OID	640882582
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_001418219
Protein GI	154247261
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGTC TGCCCCACCC CCACCTTCAG GGCGCGCCGG TGCGCCACAG CGCGCTCGTG 
CCCGGCTACA TGTCCGGCTT CGGCAATTCG TTCGAGACCG AGGCGCTGGA AGGCACCTTG 
CCCATCGGCC GCAACTCGCC GCAGAAGATC AATTACGGGC TCTATGCCGA GCAGCTCTCC 
GGCTCGCCCT TCACCGCGCC GCAGGCGGTG AACGAGCGCT CCTGGCTCTA CCGCATCCGG 
CCCACGGTGA AGCATTCCGG TCGCTACCGC CGCGTGGACA AGGGCCTGAT CCGCACCGCG 
CCCATGGCCC GCGACGAGAG CGAGTTGACG CTCGGCCAGT ACCGCTGGAG CGCGCTCCCG 
CTACCGCAGG ACAAGCGCAC CTTCGTTTCG GGCCTTGCCA CCCTGACCAC GGCGGGGGAC 
GCCGATGGCC AGAGCGGCAT GGCGGCCCAC ATGGCCTTCG TCACGGCGTC CATGGAAAAC 
GACTATTTCT TCAACGCGGA CGGCGAATTG CTGGTGGTGG CGCAGCAGGG GGCGCTGCGC 
TTCCGCACCG AATTCGGCGT CATCGACATC GCGCCCGGCG AGATCTGCGT GATCCCGCGC 
GGCGTGATCT TCAAGGTGGA GCTGATCGAC GGGCCGGCCC GCGCCTATGT CTGCGAGAAT 
TACGGCGCCA CCTTCACCCT GCCGGACCGT GGCCCCATCG GCGCCAATTG CCTTGCCAAC 
CCGCGCGACT TCCTCACCCC CGTCGCCGCC TACGAGGACC GGGAGGAGCC CTCGCAGCTG 
TTCGTGAAGT GGGGCGGCGA ATTGTTCGTC ACCGACATCG GCCAGTCGCC CCTCGACGTG 
GTGGCCTGGC ACGGCAATTA CGCGCCGTAC AAATATGACC TGCGCACCTT CTCGCCCGTC 
GGCGCGCTGA TGTTCGACCA TCCGGACCCG TCCATCTTCA CCGTGCTCAC CTCGCCGTCG 
GGCACGCCGG GCACGGCCAA CATCGATTTC GTCATCTTCC CCGAGCGCTG GATGGTGGCG 
GAGAATACGT TCCGCCCGCC GTGGTACCAC CGTAACATCA TGTCCGAATT CATGGGGCTC 
ATCTTCGGCG TCTACGACGC CAAGCCCGAG GGCTTCGAGC CCGGCGGCTT CTCCCTGCAC 
AACCTCATGC TGCCCCACGG GCCGGACGAG CAGGCCTTCG AGCACGCCTC CACCGGCGAG 
CTGAAGCCGG TGAAGCTGGA GAATACGCTG GCCTTCATGT TCGAGACCCG CGTGGCCCAG 
CGCGTCACCG CCTATGCCGC CGGCGTGCCG CAGCTCCAGG CCGATTATGT GGACTGCTGG 
GCCGGCCTGA AGAAGCGCTT CGACCCTACC CGCAAGGATG CGTGGTGA

Protein sequence

MNSLPHPHLQ GAPVRHSALV PGYMSGFGNS FETEALEGTL PIGRNSPQKI NYGLYAEQLS 
GSPFTAPQAV NERSWLYRIR PTVKHSGRYR RVDKGLIRTA PMARDESELT LGQYRWSALP 
LPQDKRTFVS GLATLTTAGD ADGQSGMAAH MAFVTASMEN DYFFNADGEL LVVAQQGALR 
FRTEFGVIDI APGEICVIPR GVIFKVELID GPARAYVCEN YGATFTLPDR GPIGANCLAN 
PRDFLTPVAA YEDREEPSQL FVKWGGELFV TDIGQSPLDV VAWHGNYAPY KYDLRTFSPV 
GALMFDHPDP SIFTVLTSPS GTPGTANIDF VIFPERWMVA ENTFRPPWYH RNIMSEFMGL 
IFGVYDAKPE GFEPGGFSLH NLMLPHGPDE QAFEHASTGE LKPVKLENTL AFMFETRVAQ 
RVTAYAAGVP QLQADYVDCW AGLKKRFDPT RKDAW