Gene Nther_2054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_2054
Symbol
ID	6315572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	-
Start bp	2171174
End bp	2172349
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	41%
IMG OID	642644442
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_001918209
Protein GI	188586664
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000000013313
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0000000115511
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTGAGAT TTGAACAGAT GCAGGAAAAT GAGTTTGTAT TGCCTACTAA AACTAAGCAC 
GGATTAGGAA TTATCAAGGA AATTGCCAAT GAGTTAAAGG AACTTAACGT AAGTAAGCCA 
ATTATTGTAG CTGATAAGGG AGTTATTGAT GCAGGACTTA TCAAACCTAT TGAAGAGTCA 
TTAAATGAAG CAGGTATCCC CTATGCAGTT TATGATGGGG TAGAAGCAGA TCCAGATTTG 
GAAATAGTAG CCAATGGTAC TAAAGCATAT AAAAAAGAGA ATTGCGATGG TATGATTGCT 
GTTGGTGGGG GAAGCTCCAT GGATACTGCA AAGGCTATGG GACTAGAAAT TTCTCATGAT 
GGCCCTGTTG TAGAATATGA AGCCGCTGAG GGTAAGAAAC CAATGACTAA AAGAATACCA 
CCATTGGTGA CTGTTCCTAC GACTGCAGGA ACCGGAAGTG AAGTTACCCT ATGGGCTGTA 
ATAAAAGACC CTGAGAGAGA ATTTAAATTT AATACTGGTG GACCATTGAT TACGGCTCAT 
TTAGCATTGA TTGATCCTGA ATTACATGTT ACAATGCCCC CATCTATTAC AGCAGGAACA 
GGAATGGATG CACTTTGTCA TGCTATAGAA TGCTATACTT GCCACTATTC TCAACCAACT 
ACTGATGCAG CAGCACTTTT AGCCATTGAG TACGCAGGTA AATATCTCCG ACGAGCAGTA 
GGTAATGGTC AAGATATAGA AGCTCGTTAT GGTATGGCTA TGTCAGCTAT GTTAGCAGGT 
ATATCATACG GAGGCGATAG TGCTGGAGCA GTTCATGCCA TGACTCAAAC ACTAGGAGGA 
ATTATCTCTG TACCTCATGG TCAGGCAGTA GCAGCTACCT TAGCTCCTGC AATGGAGTAT 
AACTGGATTG GAGCACCTCA TAAGTTTGCG CGCATTGCCA ATGCTCTAGG TGTAGATACT 
CACGGTATGG ACTTACATGA AGCTGCTAGG GCTTCTGTTG AGGCAGTGTA TCAGCTATCT 
GAAGACATTG ATGTGCCGAC TTTAGGCGAT TTAGGTGTAT CAGAAGACAT GATTCCTAGG 
CTTGCTAAAG AAGCTTATTA TGATCCACAA ACAGTTGGAA ATCCAAGAGA TATCGATGTA 
AAAGGATATG AAGAAATTTA TCGTTCATGC TTCTAA

Protein sequence

MLRFEQMQEN EFVLPTKTKH GLGIIKEIAN ELKELNVSKP IIVADKGVID AGLIKPIEES 
LNEAGIPYAV YDGVEADPDL EIVANGTKAY KKENCDGMIA VGGGSSMDTA KAMGLEISHD 
GPVVEYEAAE GKKPMTKRIP PLVTVPTTAG TGSEVTLWAV IKDPEREFKF NTGGPLITAH 
LALIDPELHV TMPPSITAGT GMDALCHAIE CYTCHYSQPT TDAAALLAIE YAGKYLRRAV 
GNGQDIEARY GMAMSAMLAG ISYGGDSAGA VHAMTQTLGG IISVPHGQAV AATLAPAMEY 
NWIGAPHKFA RIANALGVDT HGMDLHEAAR ASVEAVYQLS EDIDVPTLGD LGVSEDMIPR 
LAKEAYYDPQ TVGNPRDIDV KGYEEIYRSC F