Gene Moth_2191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2191
Symbol
ID	3832866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2289914
End bp	2291935
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	52%
IMG OID	637830113
Product	hydrogenase 4 subunit B
Protein accession	YP_431023
Protein GI	83591014
COG category	[C] Energy production and conversion [P] Inorganic ion transport and metabolism
COG ID	[COG0651] Formate hydrogenlyase subunit 3/Multisubunit Na+/H+ antiporter, MnhD subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.660892
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTACGC AACAGCTTCT GCTACTCTCT GTGCTCTTGT ACGTTGCCGG AGCCCTTGCC 
TCCCTGGCTC TTAATCGGGC CGGTAAAATT GCCAACTATG CTTCAGGTAT AAGTGCCCTT 
GCAGCAGCAG GTACCGGGAT GGCCTCGGCC GTCCAGGTAC TTGCCGGCGG AGCAGCTTTT 
ACCTGGGAAG CGGCGGGGTT TATACCCTTT GCCAAGTTTA TTATAAAGGT TGATCCCCTC 
TCTGCCTTTA TGTTACTGGT TATTTCCCTT CTGACAGGGG CTACGGCTCT ATATTCCCTC 
TCGTACCTGG ATGAGTATAC CGGTAAAGGC GCAGGGGTTA TGGGTTTTTT CAATAACCTC 
TTTATTGCCT CTATGGTATT AGTGGTCATT AGTGGGAATG CTTTTTATTT TCTAATTTTC 
TGGGAACTGA TGACGCTGGC CTCTTATTTC CTGGTTAGCT TTGATCAGGA AGACAGTGAA 
GCTGTCAAGG CCGGGTTCAT CTATCTTTTT ATGGCCCACG CGGGAACGGC TTTGATTATG 
CTGGCTTTTA TCTTATTCTT TGTCTATACA GGTACCTTCG ATTTCGCTTC CTTCCGTGGG 
GCGAACCTCC CGGTGTTTAC AAAGAGCTTG ATCTTCCTGC TAGCTTTCCT GGGATTCGGG 
GCCAAGGCCG GTATTATTCC GCTCCATATC TGGCTGCCGA AGGCTCACCC GGCTGCTCCG 
TCCAACGCTT CCGCTCTCAT GTCGGGTGTC ATGATTAAAA CCGCTATCTA TGGTATTCTC 
AGGGTCAGTG TCGATTTCCT GGGGGCTTCT GTTTGGTGGT GGGGATTTAT TGTCCTGGCC 
TCCGGAGCGA TTTCAGCAGT TCTGGGTGTT CTCTACGCCC TGGGGGAGCA CGATATAAAG 
CGGCTGCTGG CCTATCACAG TGTTGAAAAC GTTGGGATTA TATTGATGGG AGCCGGCGCC 
GGCATGATCG GCATCGCTGC CGGCCAGCCT GTTTTAGGAG TACTCGGGAT CCTGGCAGGC 
CTCTACCACT TGTTAAACCA TGCCGTCTTT AAAGGCTTGC TCTTTCTTGG GGCAGGTTCG 
GTAATATATC GAACCCATAC GAAACATATG GAGGAACTTG GCGGACTGGC CAGGCGCATG 
CCCTGGACGG CACTCGCTTT TCTGGTTGGT GCTGTAGCCA TCTCAGCCAT CCCTCCCCTC 
AACGGATTTG TCAGTGAGTG GTTTACCTAC CAGTCGTTGT TTATTGCGAG CACCAGCAGC 
ATCCTGGCTG TGAGAGTGTT TGCGCCCCTG TTTGTTGTTA TGTTAGCCCT GACGGGCGCG 
CTGGCGGCGA TGTGTTTTGT GAAGGCATAT GGGGTTACTT TTGGCGGTCC CTGTCGCAGC 
GGGCATGCCC GTGAGGCCAG GGAGGTTCCC ATACCGATGC TTGCCGGGAT GGCAATTCTG 
GCAATTAGCT GCATTATCCT CGGTGTGGGT GCACCGGTTG TTGCTCCTTA TATTGGAAAG 
GTGGCTTCGG CATTATTAGC CATTACTGCG GTCCAGGTAA GCGACGGTTT GCTGGTATTT 
CCTGCAAACA GCATGCAGGC CATGCTCTCC ACACCGCTCA TCGCCATTCT CCTCGTTGGT 
CTTGCTACGT TACCCTTGTT AATTATCGGG ATCCAAGGTG GTTTCCAGGC CGGACGGCGT 
ATCGATGCTG AGCCGTGGGC ATGTGGATAC AAGTATTCAC CGCGGATGGC CTATACCGCA 
ACTGCCTTTG CTCAGCCGTT GCGCGTACTT TTTCGGCCGG TTTATTCGCT CAGGACCACC 
CTCGATGGAC CTGGCTATAC CGTTGCATCG TATTTCAAAG GAGCAGTGGT CTACATCGCC 
AGTGTAGAAT CGTTGTGGGA ACGTTACATT TACGCTCCTC TGGCACGGGG CACGGTATAT 
CTGGGTAAAA AATTGCAGGC CTTCCAGATA GGGAACGTCA GGCTATATTG TCTCTATATA 
ATCATAACCC TCGTAGTCCT GTTATTAGCG ACGGTTAGAT AG

Protein sequence

MLTQQLLLLS VLLYVAGALA SLALNRAGKI ANYASGISAL AAAGTGMASA VQVLAGGAAF 
TWEAAGFIPF AKFIIKVDPL SAFMLLVISL LTGATALYSL SYLDEYTGKG AGVMGFFNNL 
FIASMVLVVI SGNAFYFLIF WELMTLASYF LVSFDQEDSE AVKAGFIYLF MAHAGTALIM 
LAFILFFVYT GTFDFASFRG ANLPVFTKSL IFLLAFLGFG AKAGIIPLHI WLPKAHPAAP 
SNASALMSGV MIKTAIYGIL RVSVDFLGAS VWWWGFIVLA SGAISAVLGV LYALGEHDIK 
RLLAYHSVEN VGIILMGAGA GMIGIAAGQP VLGVLGILAG LYHLLNHAVF KGLLFLGAGS 
VIYRTHTKHM EELGGLARRM PWTALAFLVG AVAISAIPPL NGFVSEWFTY QSLFIASTSS 
ILAVRVFAPL FVVMLALTGA LAAMCFVKAY GVTFGGPCRS GHAREAREVP IPMLAGMAIL 
AISCIILGVG APVVAPYIGK VASALLAITA VQVSDGLLVF PANSMQAMLS TPLIAILLVG 
LATLPLLIIG IQGGFQAGRR IDAEPWACGY KYSPRMAYTA TAFAQPLRVL FRPVYSLRTT 
LDGPGYTVAS YFKGAVVYIA SVESLWERYI YAPLARGTVY LGKKLQAFQI GNVRLYCLYI 
IITLVVLLLA TVR