Gene Ksed_11020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ksed_11020
Symbol
ID	8372610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Kytococcus sedentarius DSM 20547
Kingdom	Bacteria
Replicon accession	NC_013169
Strand	+
Start bp	1129044
End bp	1130144
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	73%
IMG OID	644991380
Product	amidohydrolase, imidazolonepropionase
Protein accession	YP_003148907
Protein GI	256824947
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	0.161229
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0546284
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCG CACAGCAGCC CGTCTGGCAC CTCACGGGCC AGGTCATCAC CGGCCCCGAG 
GAGGTCCGCT CCGAGGCGTG GGTGGTCGAC GGCCGCCTCA CCTTCGAGGC GCCGCCGGCC 
GCGATGCCGA CCGAGCGCCT GGAGGGCTAC GTGCTGCCCG GCCTCGTGGA CGCCCACTGC 
CACGTGGGGC TGGAGGCCGA TGGGGGAGTG CCGGCCGAGC GGGCCGAGGA GCACGCGGTC 
TCCGAACGCG AGGCCGGTGC GCTGCTCCTG CGCGATGCCG GCTCGCCGGT GGACACCTCG 
TGGATCCAGG AGCGCGAGGA CCTGCCGCGG CTCATCCGGG CCGGGCGACA CATCGCCCGC 
CCGAAGCGCT ACATCCGCAA CTTCGCCCAC GAGATCGAGC CGGACCAGCT GGTCGAGTAC 
GTCCGTCGCG AGGCCCGCGC CGGTGACGGC TGGGTGAAGC TGGTGGGGGA CTGGATCGAC 
CGCGACGCCG GTGACCTGCG ACCCCTGTGG CCCGTCGACG TGCTCACCGA GGCGATCGCG 
GCGGCCCACG AGGAGGGGGC GCGGGTCACC GCGCACTGCT TCGACGAGCA GTCCCTCTTC 
GACTTCGCCG CCGCCGGGAC CGACTGCATC GAGCACGCGA CCGGCCTGAC GCCGGAGTCG 
GTGGAGATCT TCGCCGCGCA GGACATCGCG ATCGTCCCGA CGCTCATCAA CATCGAGAAC 
TTCCCGGCCT TCGCAGCGGC GGGCGAGGCC AAGTTCCCCG CCTACGCCGC CCACATGCGC 
GACATGTTCG AGCGCCGCTT CGAGACCGTC GCCCTCGCAC GGGAGGCCGG GGTGCGCATC 
TACGCCGGGA CCGATGCGGG GGGCCAGCTC CCGCACGGCC TGATCGCCCG CGAGGTCGAG 
GCCCTGATGT CGGTGGGCAT GAGCGCTACC GAGGCCATCG GGGCCGCGAC CTGGGAAGCC 
CGGGAGTGGC TGGGCCACGA GGGCCTGGTC GAGGGCGCGA GTGCCGACGT GGTCGTGTAC 
GCCGACGACC CGCGCCAGGA CGTGCGGGTG CTGGCGGACC CGCAGCACGT GCTCCTGCGC 
GGCGCGCGCC ACGGTGGCTG A

Protein sequence

MSTAQQPVWH LTGQVITGPE EVRSEAWVVD GRLTFEAPPA AMPTERLEGY VLPGLVDAHC 
HVGLEADGGV PAERAEEHAV SEREAGALLL RDAGSPVDTS WIQEREDLPR LIRAGRHIAR 
PKRYIRNFAH EIEPDQLVEY VRREARAGDG WVKLVGDWID RDAGDLRPLW PVDVLTEAIA 
AAHEEGARVT AHCFDEQSLF DFAAAGTDCI EHATGLTPES VEIFAAQDIA IVPTLINIEN 
FPAFAAAGEA KFPAYAAHMR DMFERRFETV ALAREAGVRI YAGTDAGGQL PHGLIAREVE 
ALMSVGMSAT EAIGAATWEA REWLGHEGLV EGASADVVVY ADDPRQDVRV LADPQHVLLR 
GARHGG