Gene Msed_1429 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1429
Symbol
ID	5104799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1399327
End bp	1400433
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	47%
IMG OID	640507317
Product	NADH-ubiquinone oxidoreductase, chain 49kDa
Protein accession	YP_001191510
Protein GI	146304194
COG category	[C] Energy production and conversion
COG ID	[COG3261] Ni,Fe-hydrogenase III large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.519726
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGTTA TAGGAGATAT AGGGCCTTAC TGCCTGACCT CAGACGGGCT CAGAGAAGGA 
CCGTGCATTA AGGACCAGAG CGAAGAGGAG AGTCTGGGCT ATGGTTCATT CAAGTTCGTT 
TATGGCCCGT CAGCTGGGGG TCTACTGGAG TCAGTGGGAT TTGAAATTAC AACTTATGGA 
GAAAGCATAG AGAAAATAAA TCATTTACCA TATAAGGGTA GACAAATAAC TCTCTCCGGG 
CTGACAATTG GAGATGCCCT CCTTAGAGTT GAGAGAATTA ACGGAGCGTT CACCGCATCT 
CATTCCATCT CTTTTCTTCA GGCAATTGAG AGTGCCTTAG AGATAGAGGT GCCTCACGAC 
GTTGTTATTT CTAGGATGGC TCAGCTCGAG CTTGAAAGGA TAAGGAATAA TCTACTCGTG 
ATTCAGAGGG TATTGGAATC GGCATCGTTC CTGGTTCCAT CATTTCTTCT TCTCCAGCAG 
ATAGAGGAGG TTAACAGGGC CATAGCGAGG TCTTGCGGTC ATAGATATTT CTTTGGGGCT 
AACTACCCAG GAGGAGTTAG ATGTGAGCTT AAGCTTCCGT CTCTTAAGAT TTCGGACATA 
GAGAGAACGC TAGAGAACAG GATCTTCATT GACAGACTCC AAGGCAATGG AGTGGTTAAG 
GATAGCTTCT CCATTGGGCC TGTCGCCAGG GCCTCTGGGT TCAAGTACGA CGCAAGGCTA 
GACTCGGATT TTCTAGCTTA CAGGAACTTT GACCTGAGAA TCCCTACTCA GGATCAGGGA 
GATGCCTTCT CCAGGATCCT AGTTCGTCTG GAGGAGATTA AGGAATCGCT TAGGCTACTC 
CAGGAGCTCA AGGTAAAACC CTGTAGTTTC ACCATGAAGA TAAGGGATGG AGAGGGAATA 
GGAAGAGTTG AGAGCCCATC TGGAGATCTG GCTTACCTCA CAAGGGTGAG GAGTGGCCAC 
GTGGAGAGAG CATACCTTTT AGCTCCATCA AAGGTAAACA TGAGACTTTT CCTCAAGTCC 
ATGCCTGGAA ATATCTTCAC TGACTTTCCC TTCAACTGGG AAAGTTTCGG GATCTGGATA 
TCTGAGCTCG AGGTCGATCT GGAATGA

Protein sequence

MRVIGDIGPY CLTSDGLREG PCIKDQSEEE SLGYGSFKFV YGPSAGGLLE SVGFEITTYG 
ESIEKINHLP YKGRQITLSG LTIGDALLRV ERINGAFTAS HSISFLQAIE SALEIEVPHD 
VVISRMAQLE LERIRNNLLV IQRVLESASF LVPSFLLLQQ IEEVNRAIAR SCGHRYFFGA 
NYPGGVRCEL KLPSLKISDI ERTLENRIFI DRLQGNGVVK DSFSIGPVAR ASGFKYDARL 
DSDFLAYRNF DLRIPTQDQG DAFSRILVRL EEIKESLRLL QELKVKPCSF TMKIRDGEGI 
GRVESPSGDL AYLTRVRSGH VERAYLLAPS KVNMRLFLKS MPGNIFTDFP FNWESFGIWI 
SELEVDLE