Gene Msed_1301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1301
Symbol
ID	5104552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1279946
End bp	1281022
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	53%
IMG OID	640507190
Product	galactose 1-dehydrogenase / glucose 1-dehydrogenase
Protein accession	YP_001191383
Protein GI	146304067
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCAA TTATTGTAAG GCCACCTAAT GAGGGTGTCG AGGTTAAGGA CATCACATTG 
AGGGAATCCA CGGACGGGAA GATAGTTGTC AGGACTAGAC TCAGCGGTCT GTGTGGAACA 
GATAGGGGTC TAGTCACGGG AAGGCTTACC TTCGCAAGGC CTCCACCGGG ATACGATTTC 
CTTATCCTGG GTCACGAGAC TCTTGGTGAA GTGGTAAAGG GTAATGGAGA GTTCAGTCCC 
GGGGACCTAG TTGTTCCAGT GGTCAGGAGG GGTTGTGGAT CCTGCCTAAA CTGTATGCTG 
GGAAGGCAGG ACTTCTGTGA AACCGGAAGA TTCACGGAGA TCGGAATAAG GGGAGCTCAC 
GGTACCATGA GGGAGGAGTT CTTAGAGGAC CCAAAGTACC TAGTTAGGGT TCCAAGGGAA 
CTAGGAGATG AGGGAGTTCT ATTGGAGCCT CTCTCAAATG TCGTGAAGGC CCTCACAGAG 
ATGGAATATC TTCAGAGGAG GTCGTGGTGG AGGTGCGACG ATTCCACCTA CTCGTGCAGA 
ACAGCTGTGG TACTGGGGAG TGGACCCATA GGTCTCCTGT TCTCCATGGC CCTGAGAAGT 
ATGGGCTTCC GCGTGATTGT GGCGAACAGG AGGCCCCCAT CCCAGGTTGA GAGCGAAATA 
ACTCGAGATA TAGGGGCAAC CTTCCTCAAC ACCTCTGAGC ATGAGGACCT TGAGCCAGAT 
CTCATTGTGG ACACCTCTGG GCATCCCTCA GCCGTCGTCC CCTTACTTCC TAGAATCAGG 
AAGAACGGTG CGGTGATCCT CTTTGGAACA ACTGGGCTAG AGAGATATGA GCTAACTGCA 
GAGGAGATAA CCATGTTGGT TGAGAACAAC ATCCTGATCT TTGGGAGCGT GAATGCCTCA 
AAGGCCGATT TCCAGGCTGG AGTTAACCTT CTAGTGGAAT GGAAGGCCAG GTATCCAGGC 
GTCCTCCAAA GGATGATCAC CAAGAGGGTC AGCGTGGAAG AGGCCCCCCA AGTCCTGAAG 
GAAAAGGTCC CGGGGGAGAT AAAGACGGTC ATAGACTGGA CTGCTCGTGA GAGTTAA

Protein sequence

MKAIIVRPPN EGVEVKDITL RESTDGKIVV RTRLSGLCGT DRGLVTGRLT FARPPPGYDF 
LILGHETLGE VVKGNGEFSP GDLVVPVVRR GCGSCLNCML GRQDFCETGR FTEIGIRGAH 
GTMREEFLED PKYLVRVPRE LGDEGVLLEP LSNVVKALTE MEYLQRRSWW RCDDSTYSCR 
TAVVLGSGPI GLLFSMALRS MGFRVIVANR RPPSQVESEI TRDIGATFLN TSEHEDLEPD 
LIVDTSGHPS AVVPLLPRIR KNGAVILFGT TGLERYELTA EEITMLVENN ILIFGSVNAS 
KADFQAGVNL LVEWKARYPG VLQRMITKRV SVEEAPQVLK EKVPGEIKTV IDWTARES