Gene Moth_0981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0981
Symbol
ID	3830857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1008293
End bp	1009339
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	54%
IMG OID	637828910
Product	respiratory-chain NADH dehydrogenase, subunit 1
Protein accession	YP_429839
Protein GI	83589830
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTGG AAGATATCTT TACCGGCATA GCCGCTTACC TGCGGGGGTT CCTTGCCGGA 
GCACCGCCCT GGGTGGTGAC CCTTGCCATA GGGGTCTTAT ACCTGATCGG GGTACTGGCC 
TTTATCTTCC TGAATGCCCT TTATTTAATC TATCTGGAAC GGAAGATAAG CGCTTATATG 
CAACAGCGCA TCGGGCCCAA CCGTTTGGGG CCCCATGGCC TCCTGCAGTC AGTGGCCGAT 
GCGGTTAAAC TCCTGGGGAA AGAGGATATC ATACCCCGGG GGGCTGACCG GTGGGTCTTT 
ATCATCGCCC CGGTGCTAAT CTTTATCCCG GCGACGATGC TTTATGCCGT CATTCCCTTT 
GGCAAAGGAA TGGTTCCCGC TGATTTAAAT ATTGGTGTCT TTTATTTCCT GGCGGTCGCT 
TCAACTACAA CCATCGCCAT CTTGATGGGC GGCTGGGGTG CCAACAACAA ATATGCCCTG 
CTGGGCAGCA TGCGTTGTGT AGCCCAGATG GTCAGTTACG AAATCCCCCT GACCTTTTCC 
ATCCTGGGGG TAATAATGCT GGCCGGGTCC CTCCAGACCT CCCAGATCGT GGCCGCCCAG 
GGGAAGATCT GGTATATCCT TCTTCAGCCC CTGGCCTTTA TTATCTACTT TATTGCTGCC 
ACGGCCGAGG TCAACCGTGC TCCCTTTGAC CTGGTGGAAG GGGAACAGGA GATTATTGCC 
GGACCTTATA CAGAATACAC CGGCATGCGT TACGCCCTCT TTTATCTTTC AGAGTATGCC 
AACCTGGTCA GCGTTTCCGC CCTTGCGGTA ACCCTGTTCC TGGGCGGCTG GCAGGGGCCG 
TGGTTGCCGT CATGGCTATG GTTTCTAATT AAGGTTTATA TTATGATTTT TATCTTCATG 
TGGGTACGCT GGACCTTCCC TCGTATCCGT ATTGACCATC TGCTCAGCTT TAACTGGAAG 
GTGCTCCTGC CCCTGTCCCT GGCCAATATC CTGGTGACCG GGGTGGGCAT TAAGATCTAC 
CAGTTGTTAA CCCTGGGGAG GTGGTAG

Protein sequence

MTVEDIFTGI AAYLRGFLAG APPWVVTLAI GVLYLIGVLA FIFLNALYLI YLERKISAYM 
QQRIGPNRLG PHGLLQSVAD AVKLLGKEDI IPRGADRWVF IIAPVLIFIP ATMLYAVIPF 
GKGMVPADLN IGVFYFLAVA STTTIAILMG GWGANNKYAL LGSMRCVAQM VSYEIPLTFS 
ILGVIMLAGS LQTSQIVAAQ GKIWYILLQP LAFIIYFIAA TAEVNRAPFD LVEGEQEIIA 
GPYTEYTGMR YALFYLSEYA NLVSVSALAV TLFLGGWQGP WLPSWLWFLI KVYIMIFIFM 
WVRWTFPRIR IDHLLSFNWK VLLPLSLANI LVTGVGIKIY QLLTLGRW