Gene Mpal_2770 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_2770
Symbol
ID	7270880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	2898350
End bp	2899420
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	59%
IMG OID	643571356
Product	Alcohol dehydrogenase zinc-binding domain protein
Protein accession	YP_002467749
Protein GI	219853317
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.656616
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCAT TCGTAATGAA GAGGATTGGA GAAGTTGGTT GGATGGAGAA AGATAGACCT 
GCGTGCGGTC CACTGGACGC CATCTGCCGG CCACTTGCCC TTGCACCGTG CACGTCCGAT 
GTCCACACGG TCTGGGAAGG AGCCCTCGGC GACCGCCACA ACATGACCCT CGGGCACGAG 
GCCCTGGGTA TCGTTGACGA GGTGGGAAGT GAGGTCAAGG ACCTCAAGAA AGGCGACCGC 
GTCATTGTGC CGGCCATCAC ACCGGACTGG GGCGATGAAG CCTCACAGCG TGGGTACCCC 
TCGCAGTCGA CTGGAATGTG TGGCGGCTGG AAGTTCTCGA ACTTCAAGGA CGGTGTCTTC 
GCCGAGTTCT TCCACGTGAA CGAGGCGGAC AACAACCTCG CAAAACTCCC TGAAGGCATG 
TCCCTCGAGG CAGCCGTCAT GATGCCTGAC ATGATGAGCA CGGGCTTCAT GGCCGCTGAG 
AACGCGAGGA TCCCGATCGG TGGCTCGGTC GCGGTCTTCG GCATCGGACC GGTCGGCCTC 
TGCGGTATCG CAGGAGCGAA ACTTCGGGGA GCCGGACGGA TCTTCGCCAT CGGAACCCGA 
GCCAAACCCA TCGAGGTCGC GAAGGCATAC GGCGCGACCG ATATTATCAG TTACAAGAAC 
GGCGACACCG TTAAGCAGAT CATGGATCTG ACCCATGGAG CGGGCGTCGA CTCTGTCATC 
GTCTCCGGCG GCGGACCTGA CATCCTCGTG GACGCCATTA ACGTGGCCAA GGCCGGGGGT 
GCCATCGGGA ACAACAACTA CTTTGGCAAG GGTATGTTCG ACAAGGATTA CCTGCCAATC 
CCTCGTGTAG GCTGGGGCTT TGGTATGGCC AGCAAGGACA TCATCACTGG TCTCTGCCCC 
GGCGGAAAGG TCCGGATGGA GCGGCTCGCC GAGATCATCA AGTACAAGCG CATGGATCCA 
GGGCTCATGG CAACTCATGT CTACAAAGGC CTCGACAAGG TCGAGGATGC GCTCATGATG 
ATGAAGAGCA AGTCTGGCGA TCTGATCAAG CCTGTCGTCA TCTGCGAGTA G

Protein sequence

MKAFVMKRIG EVGWMEKDRP ACGPLDAICR PLALAPCTSD VHTVWEGALG DRHNMTLGHE 
ALGIVDEVGS EVKDLKKGDR VIVPAITPDW GDEASQRGYP SQSTGMCGGW KFSNFKDGVF 
AEFFHVNEAD NNLAKLPEGM SLEAAVMMPD MMSTGFMAAE NARIPIGGSV AVFGIGPVGL 
CGIAGAKLRG AGRIFAIGTR AKPIEVAKAY GATDIISYKN GDTVKQIMDL THGAGVDSVI 
VSGGGPDILV DAINVAKAGG AIGNNNYFGK GMFDKDYLPI PRVGWGFGMA SKDIITGLCP 
GGKVRMERLA EIIKYKRMDP GLMATHVYKG LDKVEDALMM MKSKSGDLIK PVVICE