Gene Msed_1064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1064
Symbol
ID	5104275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	993194
End bp	995215
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	52%
IMG OID	640506959
Product	aldehyde oxidase and xanthine dehydrogenase, molybdopterin binding
Protein accession	YP_001191152
Protein GI	146303836
COG category	[C] Energy production and conversion
COG ID	[COG1529] Aerobic-type carbon monoxide dehydrogenase, large subunit CoxL/CutL homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAAGG AACATTATCC CATAGTAGTG GGAAAGTCAC TCTACATAGA TGATATAACT 
CCCTCAAATA CTGCTTACCT TCACGTAGTT AGATCCCCGA TAGCTAGGGG AGTAATCAAG 
TCCGTGTCGG GTCCGGAGAA GGCCCTTCTA ACCTTTACGT GGGAACAGGT GAGGAACTGG 
ATCCCCGTAA GGCTCTTTGG ACCCTCAGAA GGCCTTCAGG TTACCAGAAT GCCAGTCCTA 
GCGAATGGAA GAGTGAACTT TGTGGGTCAA CCAGTAATAG CCTTTGTGGT ACAGGATAGG 
TATGAGGGAG AGGACCTCGC GGACGACGTT TCTGTAGATT ACGAGGAGCT AAATGCCGTT 
ACTGATCCTG AAACTGCCCT TGAAAGCGAG CCAATTCACC CAGAGCTCAA GAGCAATATC 
TTCATGGATC AACTCCTTCA GGGAGGCAAC CTCTCCCTTA AGGACAAGGC TGACGTGGTG 
GTGAGGAGAA AGATTAAGCA GAGCAGGGTG GCGACAAATC CCATGGAACC AAAGGGCATA 
CTGTGCTGGT GGGATGGTGA CACGCTGAAC GTTAAGGTCT CGACTCAGGC CCCCTTCGGT 
GTGAGGAATG ACCTTCACGA GTTGTTAGGG ATACCTCCGG AGAAGATCAA GGTGAGCTCA 
CCTCCAAATG TGGGGGGAGG TTTTGGAAAC AAGAGCGGAG GATACCCTGA GTACGTTCTG 
GCCGCTCTGG CCTCCCTAAA GCTGGGAAGA CCCGTGAAGT GGATTGAGAC GAGGTCTGAG 
ATACTTAACA ACGCCCAATC ACAGGGAAGA GGAGAAGTCT CAGACATGAA GCTCTACGCT 
ACCAGGTCAG GAGAAATGCT AGGAATGGAG GGAGAGGTCA TAGCGAATAT GGGTGCATAC 
GCATATGGAA TAAATTATTT CACCTCTCAG TTCGTGGCTA GGCTCTCCAA CGGTCCCTAC 
AAACTGAAGT TCGCCTCAGT TAGGGCGATT ACAGTCTACA CCAATACTCC GCCCATGGGC 
TTTTACAGGG GTGCAGGGAG ACCCGAGGCG GCATTGATTC ATGAGACCTT GGTGGAAGAT 
CTGGCGGAGG AGCTTGGAAT GGATCCTGTG GAGATAAGGA GAAAGAACCT AGTTGACGAC 
TCTGGTTACG TGACTCCACT AGGCCTGAGG TACGACGCAG CTGGATACAG GGAAGTTTTT 
GATAGGGCCG CGAACTACTA TAGGAAGCTC AGGGAAACAT CTAAGGGAGT CTCCCTAGTT 
ACCTTCACAG AAATTGTCAG AACCTCCCCA GGAGAGAGCG CCAGAATTGA GGTCAAAGAC 
AGGAAAGTGA TAGTTCACCT AGGGTTGGGC GCTCATGGAC AGGCCTATGA ATCCTCGTTC 
AGGACAGTCG TGGCTGAAGA GCTGGGGATT GACCCAGAGA AGGTTGAGGT CAAGACTGGA 
GACAGTGAAG GGGTTAAGGA GGGTATAGGG AGCTTCGGTT CCAGAGGGGG AACGATAGGT 
AGTTCAGCTG CGCTAGCTGC AGCCCAGGAA CTCAAGAGGA AGATGGGAGG AAAGGTGGAT 
CTGAGCAGGG AGATGAGTGT TGAGGTCTTT TACAGGGCAG AGGACATATT TGCCCCAGGG 
GCACATGTGG CTAAGGTAGA GCTTGACCCT GAGACGGGGA TCTTCAAGGT CGTGGAGTAC 
TATGCCGTAG ATGACGTAGG GAGAGTCCTA AACCGTGAGG AAATTGAGGG TCAGATCATA 
GGAGGTGTCC TTCAGGGAGT TTCTCAGGTC ATGATGGAGG CAGTGAAGTT CGATGAGAGA 
GGTAATCCCA TGTGCAGTTC CGTTGCAGAT TGCGGGATGT TAACGGCGGT GGAAGGGCCT 
AGAAGGGTTA ACGCAGAGTA CGTTGAGTTC AGGTCATCCC TGTTGTCGGG GTCCAGGGGA 
GTGGGCGAAG CTGGGACAAC AGGAGCCCTT CCCGCCACCT TCATAGCCCT AGAAAAGGCC 
CTAGGCAAGA AATTGAGTTC ATTACCGTTT GAGCCTCAGT AG

Protein sequence

MLKEHYPIVV GKSLYIDDIT PSNTAYLHVV RSPIARGVIK SVSGPEKALL TFTWEQVRNW 
IPVRLFGPSE GLQVTRMPVL ANGRVNFVGQ PVIAFVVQDR YEGEDLADDV SVDYEELNAV 
TDPETALESE PIHPELKSNI FMDQLLQGGN LSLKDKADVV VRRKIKQSRV ATNPMEPKGI 
LCWWDGDTLN VKVSTQAPFG VRNDLHELLG IPPEKIKVSS PPNVGGGFGN KSGGYPEYVL 
AALASLKLGR PVKWIETRSE ILNNAQSQGR GEVSDMKLYA TRSGEMLGME GEVIANMGAY 
AYGINYFTSQ FVARLSNGPY KLKFASVRAI TVYTNTPPMG FYRGAGRPEA ALIHETLVED 
LAEELGMDPV EIRRKNLVDD SGYVTPLGLR YDAAGYREVF DRAANYYRKL RETSKGVSLV 
TFTEIVRTSP GESARIEVKD RKVIVHLGLG AHGQAYESSF RTVVAEELGI DPEKVEVKTG 
DSEGVKEGIG SFGSRGGTIG SSAALAAAQE LKRKMGGKVD LSREMSVEVF YRAEDIFAPG 
AHVAKVELDP ETGIFKVVEY YAVDDVGRVL NREEIEGQII GGVLQGVSQV MMEAVKFDER 
GNPMCSSVAD CGMLTAVEGP RRVNAEYVEF RSSLLSGSRG VGEAGTTGAL PATFIALEKA 
LGKKLSSLPF EPQ