Gene Ksed_10650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ksed_10650
Symbol
ID	8372573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Kytococcus sedentarius DSM 20547
Kingdom	Bacteria
Replicon accession	NC_013169
Strand	+
Start bp	1088622
End bp	1089926
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	70%
IMG OID	644991345
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_003148874
Protein GI	256824914
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	0.233818
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.424884
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTACT ACCGCAGTGT CGGAACAATC CCCCCCAAGC GGCACACCCA GCACCGCACC 
CCCGAGGGGG GCCTGTACTA CGAGGAGCTG ATGGGGGAGG AGGGCTTCTC CTCGGACTCC 
TCCCTGCTGT ACCACCGCAA CATCCCCTCG ACCATCACCG ACGCCCGCGT CTGGGAGGTG 
CCGGACGCCT CGCTGACCCC CAACCACCCC CTGCGGCCCC TGCACCTGCG CCCCCACGAC 
CTGTTCGGCG GCGACGAGCC CACCGAGGGG GTCGATGTGG TGACCGGTCG CCGGCTGCTG 
ATGGGCAACG CCGACGTGCG GCTGAGCTAC GTGGTGGCGG ACACGGTCAG CCCCTGGTAC 
CGCAACGCCA TCGGCGACGA GTGCCTGTAC GTCGAGCGCG GCCACGCCCG GGTGGAGACC 
GTCTTCGGCG CCTTCGAGCT GGAGCAGGGT GACTATCTGA TCATGCCGCG GGCAACCACC 
CACCGCTGGA TCCCGCGCGA TGCGGGGGAC GTCGGCTACA GCGAGCCGCT GCGTGTGTAC 
GCCATCGAGG CCTCCAGCCA CATCGGTCCC CCCAAGCGCT TCCTCTCGCG GTTCGGCCAG 
CTCCTGGAGC ACGCGCCCTA CTGCGAGCGG GACCTGCGCG GGCCGACCGA GCCGCTGCTG 
GCCGAGGACA TCGGGGCGGA CCGGGCCGAG GAGACCGAGG TCTACATCCG GCACCGCGCC 
ACCGGGGAGG GCGCCTCCGG TGGGCAGGGC GGCACGATCC ACACGGTCCC CTTCCACCCG 
CTCGACGTGG CCGGCTGGGA CGGCTGCCTC TACCCGTACG TCTTCAACGT CTCTGACTAC 
GAGCCGATCA CCGGCCGGGT GCACCAGCCG CCGCCCGCCC ACCAGGTCTT CGAGGGCCAC 
AACTTCGTGG TGTGCAACTT CGTGCCCCGC AAGGTGGACT ACCACCCGTT GAGCATCCCG 
GTGCCCTACT ACCACTCGAA CGTCGACTCC GACGAGGTCA TGTTCTACGT CGACGGGGAC 
TACGAGGCGC GCAAGGGCAG CGGCATCAAA CAGGGCTCGA TCAGCCTGCA CCCGGGCGGC 
CACGCGCACG GCCCCCAACC CGGCGCGTAC GAGAACTCGA TCGGGGCCGA GTACTTCGAC 
GAGCTGGCCG TGATGGTGGA CACCTTCCGG CCCCTGGACC TCGGGGAGGG AGGGCTGGCG 
TGCGACGACG GCCGCTACGC GTGGTCCTGG CACTCCACGG CCCAGGCCTC GCAGTCCGAG 
CAGCGGGAGC GGGCGCGCCA GGAGCCGCCC ACCGCGTCTG ACTGA

Protein sequence

MAYYRSVGTI PPKRHTQHRT PEGGLYYEEL MGEEGFSSDS SLLYHRNIPS TITDARVWEV 
PDASLTPNHP LRPLHLRPHD LFGGDEPTEG VDVVTGRRLL MGNADVRLSY VVADTVSPWY 
RNAIGDECLY VERGHARVET VFGAFELEQG DYLIMPRATT HRWIPRDAGD VGYSEPLRVY 
AIEASSHIGP PKRFLSRFGQ LLEHAPYCER DLRGPTEPLL AEDIGADRAE ETEVYIRHRA 
TGEGASGGQG GTIHTVPFHP LDVAGWDGCL YPYVFNVSDY EPITGRVHQP PPAHQVFEGH 
NFVVCNFVPR KVDYHPLSIP VPYYHSNVDS DEVMFYVDGD YEARKGSGIK QGSISLHPGG 
HAHGPQPGAY ENSIGAEYFD ELAVMVDTFR PLDLGEGGLA CDDGRYAWSW HSTAQASQSE 
QRERARQEPP TASD