Gene Mthe_1053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1053
Symbol
ID	4463121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	1138435
End bp	1139487
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	55%
IMG OID	639700071
Product	respiratory-chain NADH dehydrogenase, subunit 1
Protein accession	YP_843477
Protein GI	116754359
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTATTTAT CGACAATCAT AGAGACCGTA TCTGCCTGGG CTGCCCAGGA GCCGAAGATA 
TACGCCCTGG CCATAGGCCT CATAGGGGCT GCCATAATAT CTGCAGTTAT CAACATCGGC 
GCCATGGCTG TGGTCTGGCT CGAGAGGAAG TTCCTGGGCG ATATCCAGGC CAGGTTCGGT 
CCCAACAGAG TTGGCAGTAG ATGGGGTCTG CTGCAACTGG GTGCTGATGC GATAAAGCTC 
TTCACGAAGG AGGACAGCAT ACCCAGAGGC GCGGACAAGC CTGTCTATGT CTGGGCGCCG 
ATAATAGCGA GCATAACAAC AATGCTTGTG GCAGCCGCAA TACCCTTCGG CGCGCTGAGG 
ATCGACGGGA AGGACTATCC TCTGGTCGTT GCAAACATGG ACATCAGCGC GTTCTATGTT 
GAGGCCGCTC TCTCCATAAT GACGATCGCG GTCTTCATGG CGGGCTTCAG CTCCAACAAC 
AAGTACTCGA TGCTGGGCGC GTTCAGAGGA ATCGCGAGGA TGATCGCCTA CGAGGTTCCG 
ATGGGCGTCT GTGTCATAGC TGTTGCTCTG ATGGCTCACA GTCTCAACCT GGTAGAGATC 
GTTGAGAGCC AGACTCTCTG GTACGCATTC GCCCAGCCGC TCGGGTTCAT AGTATTCACC 
ATAGCTCTTG TGACGGATCT CGGCAGGATA CCCTTCGACC AGAGCGAGGC AGAGGAGGAG 
ATCATAGCCG GATACACAAC AGAGTACGGC GGCATAAGAT GGGGCCTGCT GTATTTCCAG 
GAGTACATCA ACATGCTCCT CGGATCGATA CTTCTGGTGC TGCTCTTCCT CGGCGGCTGG 
AATGGTCCGA GCATACCCGT GATAACAGTG CTCTCTCCGA TGGTCTGGTT CCTGATGAAG 
GTCCTGATAG TGCTGATCTT CCTGATCTGG GTCAGGGGCT CTCTGGTGAG ATTCAGAATC 
GATCAGGTCA CGGATCTTGG ATGGAAGTGG ATGCTTCCGC TCTCGCTGGT AAACCTGGCG 
TGGGCAGCGT TTGTGGGTCT TTACTTCGCA TGA

Protein sequence

MYLSTIIETV SAWAAQEPKI YALAIGLIGA AIISAVINIG AMAVVWLERK FLGDIQARFG 
PNRVGSRWGL LQLGADAIKL FTKEDSIPRG ADKPVYVWAP IIASITTMLV AAAIPFGALR 
IDGKDYPLVV ANMDISAFYV EAALSIMTIA VFMAGFSSNN KYSMLGAFRG IARMIAYEVP 
MGVCVIAVAL MAHSLNLVEI VESQTLWYAF AQPLGFIVFT IALVTDLGRI PFDQSEAEEE 
IIAGYTTEYG GIRWGLLYFQ EYINMLLGSI LLVLLFLGGW NGPSIPVITV LSPMVWFLMK 
VLIVLIFLIW VRGSLVRFRI DQVTDLGWKW MLPLSLVNLA WAAFVGLYFA