Gene Namu_1805 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1805
Symbol
ID	8447410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	1980562
End bp	1981560
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	73%
IMG OID	645040934
Product	zinc-binding alcohol dehydrogenase family protein
Protein accession	YP_003201184
Protein GI	258652028
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR02822] zinc-binding alcohol dehydrogenase family protein

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.352435
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0674921
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGCGT GGGTGGTGCA ACAGTGCGCG CCGATCGACC AGGGGCCGCT GCGGCGGATC 
GAGCGGCCGG CCCCGGTACC CGGACCCGGT CAGGTCCGGG TAGCCGTGTC GTGCTGCGGG 
GTGTGTCGCA CCGACCTGCA CCTGGCCGAA GGCGATCTGC CGCCCCGGCG ACCCGAGGTC 
ACTCCCGGCC ATGAGGTCGT CGGCCGGGTG GACGCGCTCG GCCCCGGAGC CACCCGATTC 
GCCGTCGGCG AGCGGGTGGG CGTGGCCTGG CTCGCCCGGA CCGATCAGAC CTGTCGCTAC 
TGCCGCCGGG GTGATGAGAA CCTCTGCGCG GAGCCGACCT TCACCGGCTG GGACGTCGAC 
GGTGGCTACG CCGACCAGTG TCTGGTCGAC GAGCGGTTCG CCTACCGCTT GCCCGAGCAG 
GTCTCGGACG AGCAGGCCGC TCCCCTGCTG TGCGCCGGCA TCATCGGCTA CCGCGCCCTG 
CGGGTCGCAC AGGTCCCGGT CGGTGGACGT CTGGGCATCT ACGGTTTCGG CGGAAGTGCC 
CATTTAACCG CGCAGATCGC CCTGCAGCTG GGCCTGCGGG TGCACGTGCT GACCCGGGGC 
GAGCACAACC GGGCCCTGGC CCGCGAGCTG GGCGCCGACT CCGTGGCAGA CGCGACCGAC 
GAGCCGCCGG AGCCGCTGGA CGGGGCGATC CTGTTCGCGC CGGCCGGTGA CCTGGTCCCG 
GTGGCCCTGC GCGCCTTGGA CTCCGGGGCG ACCCTGGCCG TCGCCGGCAT CTGGTTGTCC 
GACATTCCCG CCCTGAACTA TCAGCGGGAG CTGTTCCGGG AACGGCGACT GCGCAGCGTC 
ACGGCCAACA CTCGACGCGA CGGTGAGGAG TTCCTCCGGC TCAGCGCCCG CTTCGGGATC 
ACGGCCACCA CCCACCGGTA TCCAATGGCC CAGGCCCCGG CCGCGCTGGC CGATCTGGCC 
CACGGGCGGT TCGGCGGGGC GGCGGTGCTG TACCACTGA

Protein sequence

MQAWVVQQCA PIDQGPLRRI ERPAPVPGPG QVRVAVSCCG VCRTDLHLAE GDLPPRRPEV 
TPGHEVVGRV DALGPGATRF AVGERVGVAW LARTDQTCRY CRRGDENLCA EPTFTGWDVD 
GGYADQCLVD ERFAYRLPEQ VSDEQAAPLL CAGIIGYRAL RVAQVPVGGR LGIYGFGGSA 
HLTAQIALQL GLRVHVLTRG EHNRALAREL GADSVADATD EPPEPLDGAI LFAPAGDLVP 
VALRALDSGA TLAVAGIWLS DIPALNYQRE LFRERRLRSV TANTRRDGEE FLRLSARFGI 
TATTHRYPMA QAPAALADLA HGRFGGAAVL YH