Gene Msed_0905 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0905
Symbol
ID	5103551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	836006
End bp	837058
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	52%
IMG OID	640506808
Product	alcohol dehydrogenase
Protein accession	YP_001191001
Protein GI	146303685
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.586977
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAAA AAGCAACTTT AGGGCGGAAA GCTTTAACTA TCCAACAAGG ATACACTTTA 
CTTATGAAAG CTATTCTATT TGAGAAATCT GGATTGGAAA ACCTAAGGGT AGGTGAGGTA 
AAAGATCCCG AACCCGGATC ACATGATGTT GTAATAAGGG TAAAGGAATC TGGGGTGAAC 
CCCATCGACT ACTTTGTCGT GGCAGGTATA CAGGTGAAGC CCATGCCCCA CATTCCAGGT 
GCAGAGGTGT ATGGAGAGGT AGAGAAGGTA GGGGATCACG TGAAGACCGT GAAACCTGGG 
GACAAGGTGG TGGTGTATAA CAGGGTGTTT GACGGCAACT GTGATATGTG CCTACGCGGG 
GATGAGATGT TGTGCAGAAA TGGTGGAATC ATGAGCCTGG TGACCCAAGG GGGCTGGGCA 
GAAAAGATGG TGGTACCGGA GAAGAACCTC GTGAAGGTAA ACCTGGATTC GGCACTGGCC 
GCAAGCTTAC CCGTAGCAGC ACTCACCTCG TACCACGCCC TTAAGGAGAC TGAGGTTGGA 
GTCGGGAAGA CAGTGGTAGT GTTTGGGGCC TCAGGGAACA CCGGTATGTT CGCAGTTCAG 
TTGGCCAAGA AGATGGGAGC GAGGGTGATA GCGGTGTCAA GAAAGTCATG GCTTAAGGAA 
TTTGGGGCAG ACGAGATCGC AGATTACTCC AACATGAAAG AGGTTGTGGA GAAGGCCACG 
AACGGGAGGA TGGCCGACGT GGTGATTAAC TCGCTGGGTA CCTCGGCCTG GGACGCTTCC 
ATGAGCGTCT TGGGACGAAG GGGGAAACTG GTTGTCTTCG GCACCCTAAC CGGGGCTGAG 
GTCAAGCTCA ACCTATCAGC AGTATATTCA GCTCATGGAC AAATTGTGGG GACTACTGGT 
GGAACCAGGG CAGAGCTTGT GGAGTTGGCA GAGATCTGCT CCGACTGCAA GGTTAAGGTT 
CACAGGGAGT ACCCTCTGGA GAAGGCAGCG GAGGCACTTA GGGAGCTCAA CTCTGGAGGT 
AGGGATGGAA GGATAATGTT GAAGATCCAA TGA

Protein sequence

MAKKATLGRK ALTIQQGYTL LMKAILFEKS GLENLRVGEV KDPEPGSHDV VIRVKESGVN 
PIDYFVVAGI QVKPMPHIPG AEVYGEVEKV GDHVKTVKPG DKVVVYNRVF DGNCDMCLRG 
DEMLCRNGGI MSLVTQGGWA EKMVVPEKNL VKVNLDSALA ASLPVAALTS YHALKETEVG 
VGKTVVVFGA SGNTGMFAVQ LAKKMGARVI AVSRKSWLKE FGADEIADYS NMKEVVEKAT 
NGRMADVVIN SLGTSAWDAS MSVLGRRGKL VVFGTLTGAE VKLNLSAVYS AHGQIVGTTG 
GTRAELVELA EICSDCKVKV HREYPLEKAA EALRELNSGG RDGRIMLKIQ