Gene Ksed_14840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ksed_14840
Symbol
ID	8372992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Kytococcus sedentarius DSM 20547
Kingdom	Bacteria
Replicon accession	NC_013169
Strand	+
Start bp	1525259
End bp	1526704
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	73%
IMG OID	644991756
Product	NAD-dependent aldehyde dehydrogenase
Protein accession	YP_003149274
Protein GI	256825314
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.0170872
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.129561
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCG AGCCGACGAC CGACCGGGCC GAGCCGACCA CCGACAGCAC GGGCACGACC 
GCGCAGGGCG GCGGCTTCAC CCCGGACCTG CGCGGCGTCC ACACGCTGGC CCGCCGGACC 
TGGGAGTCCG GGCGCCTGCG CAGCCTCGAG GCCCGGCGCG AGCAGCTGGA GGGGCTGAAG 
CGCCTGGTGC GCGAGGGCGG CGACGAGCTC GCGGCCGCGC TGCAGCAGGA CCTCGGGAAG 
TCCCCCACCG AGGCCCGCAC CACCGAGCTG TCGGTGGTGG TGACCGAGGT CGAGTACGTG 
CTCAAGCACC TCAAGGGCTG GTTGGAGCCG CGCAAGGCGG CGGTGCCGCT GGCCTTCCAG 
CCCGCCAGCG GTCGGGTCCG CCGGGAGCCG CTGGGGTCGG TGCTCATCAT CGGGCCGTGG 
AACTACCCCG TGAACCTCGT GCTGATGCCG CTGGTGGGCG CCTTGGCCGG GGGCAACACG 
GTCGTGCTCA AGCCCAGCGA GCTCACCCCT GCCACCGCCG AGGCCCTGGC CCGGCTGGTG 
CCGCGCTACC TGGACCCGGA GGTCGTGCAG GTGGTGAACG GCGGCGTGCC GGAGAGCACC 
GCCCTGCTCG AGCTGCCCTG GGACCACGTC TTCTACACCG GGGGCGAGCG CGTGGGGCGG 
ATCGTGATGC GGGCCGCGGC CGAGCACCTG ACGCCGGTGA CCCTGGAGCT CGGCGGCAAG 
TCCCCCACCT GGGTGGGCAC CGAGACCGAC CTGCGGACGG CGGCCCGCCG CATCGTGTGG 
TCGAAGTTCG TCAACGCCGG GCAGACCTGC GTGGCCCCCG ACCACGTGCT GTGCACCGCC 
AGCACCCAGG CCGAGCTGGT GCCCGAGCTG GAGCGTGCGA TCCGCGAGAT GTTCGGGGAC 
GACCCGCGCA CCAGCGCGGA CTACGGCCGC ATCGTGAACA CCGAGCACGC CGAGCGGCTG 
GCCGGCCTGG TGGACGGCGC GGCGATCGGT GGTGAGGTGG ACGTCGCGGG GCGCTACCTC 
TCCCCCACGG TGCTCACCGA CGTCACCGAC GACCACCCGG CCATGGCCGA GGAGATCTTC 
GGACCGGTGC TGCCTATCGT CCCGGTGGCC GACGTGCACG ACGCGATCCG CCGCGTCAAC 
GCGCGGCCGC ACCCGCTGGC GCTGTACCTG TTCACCGACG ACCTGGACGA GCAGGACCTG 
TGGCTGGCCA GCACGCGCTC GGGGGGCGTC GGCATCAACA TGCCCCTGGT GCACGTGGCC 
GTGCCGGAGC TGCCCTTCGG TGGCGTCGGC GCCAGCGGCA TGGGCAACTA CCACGGGCTG 
GCCTCGCTGG AGACCTTCAC CCACGAGCGC TCCGTGCTCT CCAAGCCGCT GGCCCCGGAC 
ACCATGCGGA TCGTCTACCC GCCCTACGGC CCGGTGAAGC AGCGCCTCAT CCGCGCCGTG 
CAGTGA

Protein sequence

MSTEPTTDRA EPTTDSTGTT AQGGGFTPDL RGVHTLARRT WESGRLRSLE ARREQLEGLK 
RLVREGGDEL AAALQQDLGK SPTEARTTEL SVVVTEVEYV LKHLKGWLEP RKAAVPLAFQ 
PASGRVRREP LGSVLIIGPW NYPVNLVLMP LVGALAGGNT VVLKPSELTP ATAEALARLV 
PRYLDPEVVQ VVNGGVPEST ALLELPWDHV FYTGGERVGR IVMRAAAEHL TPVTLELGGK 
SPTWVGTETD LRTAARRIVW SKFVNAGQTC VAPDHVLCTA STQAELVPEL ERAIREMFGD 
DPRTSADYGR IVNTEHAERL AGLVDGAAIG GEVDVAGRYL SPTVLTDVTD DHPAMAEEIF 
GPVLPIVPVA DVHDAIRRVN ARPHPLALYL FTDDLDEQDL WLASTRSGGV GINMPLVHVA 
VPELPFGGVG ASGMGNYHGL ASLETFTHER SVLSKPLAPD TMRIVYPPYG PVKQRLIRAV 
Q