Gene Swit_3059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Swit_3059
Symbol
ID	5198609
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingomonas wittichii RW1
Kingdom	Bacteria
Replicon accession	NC_009511
Strand	+
Start bp	3356580
End bp	3357629
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	69%
IMG OID	640582608
Product	gentisate 1,2-dioxygenase
Protein accession	YP_001263547
Protein GI	148555965
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3435] Gentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR02272] gentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0227445
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGCAG AAACGGCCCC CGAAACCATG GCGGCCTTCT ACGCGGAGCT CGACGGCCAG 
AACATGGCGC CGCTGTGGGA AAGCCTGCAC AGTCTGGTGC CGCGCCAGCC GGCGCCGGTC 
ATCCAGGCCG CCCATTGGGA CTATGACGCC GTCGTCCGCC CGCGCCTGAT GGAGGCGGGC 
CGGCTGATCA CCGCGAAGAA GGCCGAGCGC CGCGTGCTCA TCCTCGAAAA TCCGGGGCTG 
CGCGGCAAGG CCTCGATCAC CCAGTCGCTC TATGCCGGGT TGCAGCTCAT CCTGCCGGGC 
GAGGTCGCGC CGGCGCATCG GCACACCCAA TGCGCGCTGC GTTTCATCGT CGAGGGGGAG 
GGCGCGCACA CCACCGTGTC GGGCGAGCGT ACGATCATGC ATCCCGGCGA CTTCGTGCTG 
ACGCCGAACT GGACCTGGCA CGACCATGGC AATGAGAGCG ACGCGCCGAT GGTGTGGCTC 
GACGGGCTCG ACATTCCGAT CGTCGCCTTC CTCGACGCCG GTTTCGCCGA GGCCGGCAAT 
GCCGACAGCC AGCCAACCGT TCGCCCCGAC GGCGACGCGG AGGCGCGGTT CGGGGGCACG 
CTGCTGCCCG TGGACTGGCG GGCGTCGTCG CGGAACTCGC CGGTGCTCAA CTATCCCTAT 
GCGCGGTCGC GGGAGACGCT GCACCGGCTG GAACGCAACG GCGAGGCCGA CGCCAGCCAC 
GGATACAAGC TGCGCTACGT CAATCCGGCC GACGGCGGCT GGCCGATGCC GACGATCGGC 
GCGTTCATCC AGTTCCTGCC GGGCGGTTTT CGCACCGCGC CCTACCGGTC GACCGACAGC 
ACCGTCTATG CGGTGGTCGA GGGGCATGGC GAAAGCATCG TCGGCGATCG GCGCATCCGC 
TGGAAACCGC GCGACATCTT CGTCGCGCCG AGCTGGCAAT GGCAGGAGCA TGCCGCGAGC 
GGCGACGCGG TGCTGTTCAG TTTCTCCGAC CGTCCCGTTC AGGAGGGTCT CGGCCTGTGG 
CGCGAAGAAC GGGGCATTCC CCGCCGCTGA

Protein sequence

MEAETAPETM AAFYAELDGQ NMAPLWESLH SLVPRQPAPV IQAAHWDYDA VVRPRLMEAG 
RLITAKKAER RVLILENPGL RGKASITQSL YAGLQLILPG EVAPAHRHTQ CALRFIVEGE 
GAHTTVSGER TIMHPGDFVL TPNWTWHDHG NESDAPMVWL DGLDIPIVAF LDAGFAEAGN 
ADSQPTVRPD GDAEARFGGT LLPVDWRASS RNSPVLNYPY ARSRETLHRL ERNGEADASH 
GYKLRYVNPA DGGWPMPTIG AFIQFLPGGF RTAPYRSTDS TVYAVVEGHG ESIVGDRRIR 
WKPRDIFVAP SWQWQEHAAS GDAVLFSFSD RPVQEGLGLW REERGIPRR