Gene Ksed_10550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ksed_10550
Symbol
ID	8372563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Kytococcus sedentarius DSM 20547
Kingdom	Bacteria
Replicon accession	NC_013169
Strand	+
Start bp	1079124
End bp	1080347
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	67%
IMG OID	644991335
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_003148864
Protein GI	256824904
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.00901383
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.579453
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACA CCACCCTGAC CGCCCTGACG AACCAGGAGC AGGCCGAGAA CCTGTCCGTC 
GAGCAGCTCA AGCAGCTGGT CGGCCTGGTG GAGTACGACG GCTCCAACGA CCCCTTCCCG 
GTGACCGGCT GGGACTCCAT CGTCTTCGTG GTGGGCAACG CCACGCAGGC TGCGCACTTC 
TACCAGTCGG CTTTCGGCAT GGAGCTGGTC GCCTACTCCG GCCCCGAGAA CGGCAACCGC 
GACCACAAGG CGTTCGTCCT GAAGTCGGGC AACATCAAGT TCGTGCTGAA GGGCGCGGTG 
GACCCCCAGT CCCCGCTGCT GGACCACCAC CGCGCGCACG GTGACGGCGT GGTGGACATC 
TCCCTGGAGG TGCCGGACGT CGACCAGTGC ATCGAGCACG CCCGCTCGGT GGGTGCCACG 
GTGCTCCAGG AGCCCACGGA CCTGAGCGAC GACCACGGCA CCGTGCGCGT CGGCGCCATC 
GCGACCTACG GGGAGACCCG GCACACCCTC GTCCAGCGGG AGGTCGACGG GACCCGCTAC 
GCCGGCCCCT ACCTGCCGGG CTACGAGGCG CGCGAGGGCA CCTACGTCAA GCGCGAGGGC 
TCGCCGAAGC GCCTGTTCCA GGCCCTGGAC CACATCGTCG GCAACGTCGA GCTCGGCAAG 
ATGGATGAGT GGGTGGAGTT CTACCACCGC GTCATGGGCT TCACGGACAT GGCCGAGTTC 
GTGGGCGACG ACATCGCCAC CGACTACTCC GCGCTGATGT CCAAGGTGGT GGCCAACGGC 
AACCACCGCG TGAAGTTCCC GCTCAACGAG CCGGCGATCG CCAAGAAGAA GTCGCAGATC 
GATGAGTACC TGGAGTTCTA CGGCTGCGCC GGTGCCCAGC ACCTGGCCCT GGCCACGAAC 
GACATCATCA CGACCGTCGA CCGCATGCGT GCCGAGGGCG TCGAGTTCCT GGCCACCCCG 
GACTCCTACT ACGAGGACCC GGAGCTGCGT GAGCGCATCG GCAACGTGCG CGTCCCCATC 
GAGGAGCTGC AGAAGCGCGG CATCCTGGTG GACCGCGACG AGGACGGCTA CCTGCTGCAG 
ATCTTCACCA AGCCGATCGG CGACCGCCCC ACGGTGTTCT TCGAGTTGAT CGAGCGCCAC 
GGCTCGCTGG GCTTCGGCAT CGGCAACTTC AAGGCGCTGT TCGAGGCCAT CGAGCGCGAG 
CAGGAGCTGC GCGGCAACTT CTGA

Protein sequence

MTDTTLTALT NQEQAENLSV EQLKQLVGLV EYDGSNDPFP VTGWDSIVFV VGNATQAAHF 
YQSAFGMELV AYSGPENGNR DHKAFVLKSG NIKFVLKGAV DPQSPLLDHH RAHGDGVVDI 
SLEVPDVDQC IEHARSVGAT VLQEPTDLSD DHGTVRVGAI ATYGETRHTL VQREVDGTRY 
AGPYLPGYEA REGTYVKREG SPKRLFQALD HIVGNVELGK MDEWVEFYHR VMGFTDMAEF 
VGDDIATDYS ALMSKVVANG NHRVKFPLNE PAIAKKKSQI DEYLEFYGCA GAQHLALATN 
DIITTVDRMR AEGVEFLATP DSYYEDPELR ERIGNVRVPI EELQKRGILV DRDEDGYLLQ 
IFTKPIGDRP TVFFELIERH GSLGFGIGNF KALFEAIERE QELRGNF