Gene Svir_31830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Svir_31830
Symbol
ID	8388507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharomonospora viridis DSM 43017
Kingdom	Bacteria
Replicon accession	NC_013159
Strand	+
Start bp	3452118
End bp	3453302
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	64%
IMG OID	644977210
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_003134983
Protein GI	257057151
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.905898
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAATC CAGCACTCGA CGACGTCAGC TACGACCAAC TCCGACAACT CGTCGGTCTG 
GTCGACCACG ATCCGACCAA GGACCCCTTC CCCGTCAAGG CGATGGACGC GGTGGTCTTC 
GTGGTCGGTA ACGCCACCCA GACCGCGCAC TTCTACCAGT CGGCGTTCGG CATGGACCTC 
GTCGCCTACT CCGGACCGGA AACGGGCAAC CCCGAGTACA AATCGTTCGT CCTCAAGTCG 
GGTTCCGCGC GGTTCGTGGT CAACGGCGGG GTGAAGCCGG ACTCGCCGCT GCTGGACCAC 
CACCGCAAGC ACGGTGACGG CGTCATCGAC CTCGCGCTCG AAGTAGCCGA TGTGGACAAG 
TGCGTCGAAC ACGCCAGGGC GAACGGGGCC ACGATCCTGG ACGAACCGTA CGAGGTCTCC 
GACGAACACG GCACCGTACG CATGGCGGCC ATAGCGGCCT ACGGCGACAC CCGGCACACG 
CTCGTGGACC GCTCCCGCTA CTCCGGCCCC TACCTGCCGG GATACGAGGC GCGTACCCGC 
AGCGTGCCCA AGCCCGAGGG AGCACCGAAA CGGCTGTTCC AGGCCATCGA CCACTGTGTC 
GGCAACGTCG AACTCGGCAA GATGGACGAA TGGGTGGGGT TCTACCACCG GGTCATGGGC 
TTCGTGAACA TGGCCGAGTT CGTGGGTGAC GACATCGCCA CCGAGTATTC GGCGTTGATG 
AGCAAGGTGG TCGCCAACGG TAACCACCGC GTCAAGTTCC CGCTCAACGA ACCCGCCATC 
GGCAAGAAGA AGTCGCAGAT CGACGAGTTC CTCGAGTTCT ACGACGGCGC CGGCTGCCAG 
CACATCGCGT TGGCCACCAA CGACATCGTC GGCACGGTCC AGGCGATGCG TCAGGCGGGT 
GTGGAATTTT TGGACACGCC GGATTCGTAC TACGACGATC CGGAGTTGCG TGCCCGCATC 
GGCGAGGTGC GGGTGCCGAT CGAGACGCTG AAGGAACACC GCATCCTCGT CGACCGCGAC 
GAGGACGGCT ATCTGCTCCA GATCTTCACC AAACCGATCG GTGACCGACC CACCGTGTTC 
TACGAACTCA TCGAGCGACA CGGCTCGCTC GGTTTCGGGA AGGGCAACTT CAAAGCCCTG 
TTCGAGGCCA TCGAGCGGGA ACAGGCCCGT CGCGGCAACC TCTGA

Protein sequence

MANPALDDVS YDQLRQLVGL VDHDPTKDPF PVKAMDAVVF VVGNATQTAH FYQSAFGMDL 
VAYSGPETGN PEYKSFVLKS GSARFVVNGG VKPDSPLLDH HRKHGDGVID LALEVADVDK 
CVEHARANGA TILDEPYEVS DEHGTVRMAA IAAYGDTRHT LVDRSRYSGP YLPGYEARTR 
SVPKPEGAPK RLFQAIDHCV GNVELGKMDE WVGFYHRVMG FVNMAEFVGD DIATEYSALM 
SKVVANGNHR VKFPLNEPAI GKKKSQIDEF LEFYDGAGCQ HIALATNDIV GTVQAMRQAG 
VEFLDTPDSY YDDPELRARI GEVRVPIETL KEHRILVDRD EDGYLLQIFT KPIGDRPTVF 
YELIERHGSL GFGKGNFKAL FEAIEREQAR RGNL