Gene Moth_1883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1883
Symbol
ID	3831228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1946874
End bp	1948256
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	58%
IMG OID	637829816
Product	ferredoxin hydrogenase
Protein accession	YP_430726
Protein GI	83590717
COG category	[R] General function prediction only
COG ID	[COG4624] Iron only hydrogenase large subunit, C-terminal domain
TIGRFAM ID	[TIGR02512] hydrogenases, Fe-only

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTATA TTGATCGGGA TCTTTGTACC GGTTGCCGCC GCTGCGCCGA AATCTGTCCC 
ACAGGGGCCA TTGAGGGCAA CCAGGGTGAA CCCCAGATAA TCAATAGAGA AATCTGCGTC 
AACTGTGGCC AGTGTGTGCA AATTTGCAGC GCCTATGCTT CCCCCTATAC GACCAGCCCC 
GAGACCATGG CTGCTAAAAA CCGCGAACGC CGCCTGCTCC CGGCGGCCGC CCCCGAACCC 
TTATTCGCGG CCTATAACGA AAGCCACGAG GAGCTGGTCC GGGAAGCCCT GGCCCGGCCG 
GACCTTTTTA ATGCCGTGCA GTTCGCCCCG GCGATCCGGT TCGCCCTGGC GGAGGACTTC 
GGCCTATCAC CCCAGGTCGT TACCGTCGGC CGTATTGTCG CCGCCTTGAG GCGCCTGGGC 
TTTAAATATG TCTATGATAC CAACTTTGCC GCCGACCTAA CGGTGATGGA AGAAGGCTAC 
GAGCTGCTGC AGCGCTTGCA GGGCGACGGT GCTTTACCCC TTTTTAGCTC CTGCTGCCCG 
GCCTGGGTTA AATTTGTCGA GCAGGCTTAC CCGCAGCTAA TCGCCAACCT CTCTACCTGT 
AAATCACCCC AGCAAATGGC CGGTGCTATC TTTAAAACCT ACACCGGCCA GCTTGACCCC 
GATCTGCGCT CCCGGCACCT CTTTGTAACG GCCGTCATGC CCTGCATAGC CAAGAAATTT 
GAATGTAACC GTCCCGAGCT TGGTGGTAGC TATGGCCGCG ACGTCGACGC CGTCCTGACT 
ACCCGGGAAC TGGCCCACCT CATTAAGGAT AAGGGTATTG ACTGGCACAG CCTGGCAGAG 
GAAGAACCCG ATCAGCCCCT GGGCGAATAC AGCGGCGCCG GGGCTATCTT CGGCGTTACC 
GGCGGGGTCA CCGAGGCCGT TCTAAGGACG GCGGCCGAAG TTGTAGGCGG TAAGCCCCTG 
GAGGAGATTG AGTTCCATGA GGTACGGGGT ATGGCCGGTA CCCGCAAGGT CAATATCAAC 
CTCGGCAAAG AACAGTTGGA AATTATTATC GTGGCCGGGT TAAAGAATGT CGTCCCCATC 
CTGGACGACC TGATAGCCGG GAAGGCCAGC TTCCACTTTA TGGAGGTCAT GGCCTGCCCC 
GCCGGTTGTC TCAGCGGCGG CGGCCAACCG AAAATCCTGG TAGAAACCTA TCGCGGCTCC 
ATCTATCGCC AGCGGGCGGC CAGCATCTAC AACCACGACC GGGATCTCCC CGTGCGCAAG 
GCCCATGAAA ATCCAGCCAT CAAACAGCTC TACGCCGATT TTTTAGGCCA GCCCCTGGGC 
GAGCTATCCC ACGCCCTGCT CCATACCCAT TACACTGTCA GGAGGTCAGA AGAGAATGTT 
TAA

Protein sequence

MIYIDRDLCT GCRRCAEICP TGAIEGNQGE PQIINREICV NCGQCVQICS AYASPYTTSP 
ETMAAKNRER RLLPAAAPEP LFAAYNESHE ELVREALARP DLFNAVQFAP AIRFALAEDF 
GLSPQVVTVG RIVAALRRLG FKYVYDTNFA ADLTVMEEGY ELLQRLQGDG ALPLFSSCCP 
AWVKFVEQAY PQLIANLSTC KSPQQMAGAI FKTYTGQLDP DLRSRHLFVT AVMPCIAKKF 
ECNRPELGGS YGRDVDAVLT TRELAHLIKD KGIDWHSLAE EEPDQPLGEY SGAGAIFGVT 
GGVTEAVLRT AAEVVGGKPL EEIEFHEVRG MAGTRKVNIN LGKEQLEIII VAGLKNVVPI 
LDDLIAGKAS FHFMEVMACP AGCLSGGGQP KILVETYRGS IYRQRAASIY NHDRDLPVRK 
AHENPAIKQL YADFLGQPLG ELSHALLHTH YTVRRSEENV