Gene Namu_1092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1092
Symbol
ID	8446688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	1212947
End bp	1214002
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	68%
IMG OID	645040230
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_003200489
Protein GI	258651333
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCAG CCATGTACTA CGGGAACAAG GACATCCGGA TCGAGGAGAT CCCCGAGCCG 
ACCGTCCGCC CGGGGACGGT CAAGGTCAAG ATCGAGTGGT GCGGGATCTG CGGCACCGAC 
CTGCACGAGT ACCTGGACGG TCCCATCTTC GCGCCGCCGG CCGGATCGCC GCACCCGCTG 
ACCGGGGAAA CCGTGCCGGT CTGCCTGGGG CACGAGTTCG CCGGGATCGT CGCCGATGTC 
GGCGACGGCG TCACCAACGT CTCGGTCGGC GAGCGGGTGG TGGTCGAGCC CTACATCACC 
TGCGGCACCT GCGCCCGCTG CCGGGCCGGC ATCTACAACG TCTGCGACAC CCTGGGTTTC 
ATCGGTCTGT CCGGTGGGGG CGGCGGCTTC TCCGAATTCG TCGTCGCCGA CGCCAAGCGC 
ACCTTCCCGA TCGGCGACCT GCCCACCGAC ATCGGCGCGC TGATCGAGCC CCTGGCCGTG 
GCCTATCACG CGGTCCGGCT GTCCAAGGCC CGCCCGGGTG ACAGCGCCAC CGTCTACGGG 
TCCGGGCCCA TCGGCCTGGT CACGGTGGCG GCGCTCAAGG CGCAGGGCAT CGAGAACGTG 
ATCGTGGTGG AGCCGGCCGA GGTCCGCAAG GTCAAGGCCG CGGCGGCCGG CGCGAGCACC 
GTGCTGGACC CGACGGACAC CGACATCGTC GCCGCGATCA AGGATCTCAC CGGCGGTGTG 
GGCACCGACG TCTCGTTCGA ATGCGCCGGC TTCAACGGGG CCACCGCGCA GGCGATCAGG 
GCGACCAAGG GCGGCGGCAC CGTCGTCAAC GTGGCCATCT GGGGCCACGA GGCCACCGTC 
GCGATGAACG ACCTGGTCTT CAACGAGGTG TCGATCATCG GGTCGCTGGC CTACTGCAAC 
GACCACGAAC CCACCATCAA GCTGCTGCAG GACGGCAAAG TCGATGCCGC CCAGTTCATC 
ACCGGCAAGA TCGCGGTGGA CGACATCGTC GAGGGCGGTT TCCGCGAGCT GATCGACCAC 
AAGGCCGAGA ACGTCAAGAT CCTCGTCCAC CCCTGA

Protein sequence

MKAAMYYGNK DIRIEEIPEP TVRPGTVKVK IEWCGICGTD LHEYLDGPIF APPAGSPHPL 
TGETVPVCLG HEFAGIVADV GDGVTNVSVG ERVVVEPYIT CGTCARCRAG IYNVCDTLGF 
IGLSGGGGGF SEFVVADAKR TFPIGDLPTD IGALIEPLAV AYHAVRLSKA RPGDSATVYG 
SGPIGLVTVA ALKAQGIENV IVVEPAEVRK VKAAAAGAST VLDPTDTDIV AAIKDLTGGV 
GTDVSFECAG FNGATAQAIR ATKGGGTVVN VAIWGHEATV AMNDLVFNEV SIIGSLAYCN 
DHEPTIKLLQ DGKVDAAQFI TGKIAVDDIV EGGFRELIDH KAENVKILVH P