Gene Swit_3865 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Swit_3865
Symbol
ID	5199366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingomonas wittichii RW1
Kingdom	Bacteria
Replicon accession	NC_009511
Strand	-
Start bp	4255411
End bp	4256514
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	65%
IMG OID	640583420
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_001264348
Protein GI	148556766
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACTAT CTCAAGAGGC TGCCATGACC GACACCGCCA TCGAACCGCA TCACAACCCG 
CTGGGCCTCG ACGGTTTCGA GTTCGTCGAG TTCACCGGCC CCGATCCTCT GGCGCTCGCC 
GCGCTGTTCG AGGCGATGGG CTTCACCCAT CTCGGCGACC ACCGGTCGAA GAACGTCCGC 
CGCTACCAGC AGGGCGACGT CAACTTCATC CTCAACATGG ACAAGGGCGG CCAGGCCGCC 
GACTTCCGCG CCGCGCACGG CCCCTCGGCC AACGCCATGG CGTTCCGCGT CCATGACGCC 
GCCAAGGCGC TCGAAAAGGC GGTCGCGCGC GGCGCGACCC CGGTCGAAGG ACCGGTCGGC 
CCGATGGAGC TGCACATCCC CGCGATCGAG GGGATCGGCG GCTCCAACCT CTATTTGGTC 
GACCGCTATG GCGCGCAGGA GATCTACGAC GTCGATTTCC GCCCGGTGGC GGGCATGGCG 
CGCGACCAGC GGTCGGTCGG CCTGCACACG CTCGACCACC TGACCCACAA CGTCATGCGC 
GGCCGCATGA ATCACTGGGC CGGCTTCTAC GAGAAGGTCT TCAACTTCCG CGAGATCCGC 
TATTTCGACA TCGAGGGCCA GGCGACCGCG CTGCTCAGCC GCGCGATGAC CGCGCCCGAC 
GACAAGATCC GCATCCCGCT CAACGAGAGC CAGGACGAGA ACAGCCAGAT CGAGGAATTC 
CTGCGCGAAT ATAAGGGCGA GGGCATCCAG CACCTGGCGC TGTCGACCGA CAACATCTTC 
GAGACGGTCG ACCGGCTCCG CGCCAACGGC ATCCGTTTCC AGTCGACCCC CGCCACCTAT 
TATGAGGGGA TCGACGCCCG CCTGCCCGGC CATGGCCACG ACATCGCCGA GATGCAGAAG 
CGCGGCATCC TGATCGACGG CGCACCCGAG ACCGGCGGCG GCATCCTGCT GCAGATCTTC 
ACCGAGAACA TGGTCGGCCC GATCTTCTTC GAGATCATCC AGCGCAAGGG CAATGACGGC 
TTCGGCGAAG GCAATTTCAA GGCGCTGTTC GAGTCGATCG AGCGCGACCA GATCCGCCGC 
GGCGTGGTGA AGGTCGATGG CTGA

Protein sequence

MILSQEAAMT DTAIEPHHNP LGLDGFEFVE FTGPDPLALA ALFEAMGFTH LGDHRSKNVR 
RYQQGDVNFI LNMDKGGQAA DFRAAHGPSA NAMAFRVHDA AKALEKAVAR GATPVEGPVG 
PMELHIPAIE GIGGSNLYLV DRYGAQEIYD VDFRPVAGMA RDQRSVGLHT LDHLTHNVMR 
GRMNHWAGFY EKVFNFREIR YFDIEGQATA LLSRAMTAPD DKIRIPLNES QDENSQIEEF 
LREYKGEGIQ HLALSTDNIF ETVDRLRANG IRFQSTPATY YEGIDARLPG HGHDIAEMQK 
RGILIDGAPE TGGGILLQIF TENMVGPIFF EIIQRKGNDG FGEGNFKALF ESIERDQIRR 
GVVKVDG