Gene Moth_1606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1606
Symbol
ID	3832219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1641469
End bp	1643094
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	57%
IMG OID	637829535
Product	4Fe-4S ferredoxin, iron-sulfur binding
Protein accession	YP_430455
Protein GI	83590446
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCTA TTCCTAAACC TGAGGAATTA GTAAAGATAA ATTACCGGCC TCCCCGGACG 
GGGTGGATGG ATACTCCGGT GCAATTCCGG CGGGGCAACT ACCTATACGC CGCTAAACCC 
AAGAGCCTGG AAGTCGTCGG CCTGCCCAAT CCCAGGGAAT GGTCGCCGGA AGACGAGGAT 
TGGAAACTAC CGGAAAACTG GCAGGAGATT ATCCTGGAAG GTCTGCGGGA ACGCCTGGGA 
CGCTTCCGCT CGCTGCAGGT TTTCATGGAT ATCTGCGTCC GCTGTGGCGC CTGTGCCGAT 
AAATGCCATT TCTTCATCGG CACCGGCGAT CCCAAGAATA TGCCTGTCCT GCGGGCCGAG 
CTCCTGCGCT CGGTATACCG TCGCGACTTT ACTACCGCCG GTAAGCTCCT GGGAAGACTC 
GTCGGCGCCA GGGATTTAAC GGTCGATGTC CTGAAGGAAT GGTTCTACTA CTTTTTTCAG 
TGCACCGAGT GCCGCCGCTG CTCCCTCTTC TGCCCCTACG GCATTGATAC GGCGGAAATC 
ACCATGATCG GCCGGGAACT CCTCAACCTG GTCGGGTGCA ATATCGACTG GATTGCTTCT 
CCGGTGGCCA ACTGCTACCG CACCGGGAAC CACGTCGGCA TCGAACCCCA CGCCTTCAAG 
GATATGGTGG AGTTCTGTGT CGACGAAATC GAAAACATAA CCGGCATCAG GGTGGAACCT 
ACCTTCAACC GCAAGGGGGC GGAGGTGCTC TTTATCGCCC CTTCCGGCGA CGTTTTCGCT 
GACCCCGGGA CCTACACCCT CATGGGCTAT CTTATGCTCT TCCACGAGAT CGGCCTGGAT 
TACACCTGGA GTACCTACGC CTCCGAGGGC GGCAACTTTG GTATGTTCAC CTCCCACGAA 
ATGATGAAGA GGCTCAACGC CAAGATGTAC GCCGAGGCCA AACGCCTGGG GGTGAAGTGG 
ATCCTTGGGG GCGAGTGCGG CCACATGTGG CGGGTCATTA ACCAGTATAT GGATACCATG 
AACGGCCCGG CCGATTTCCT GGAAGTGCCC GTTTCCCCCA TCACCGGCAC GAGGTTTGAG 
AACGCCAAAT CAACCAAGAT GGTCCATATC ACCGAATTTA CGGCGGACTT GATCAAGCAC 
AATAAGCTAA AACTGGACCC CAGCCGCAAC GATAACCTGC GGGTTACCTT CCATGACTCC 
TGCAACCCGG CGCGATCCAT GGGGCTTTTT GAGGAACCGC GTTACATCAT CAAGCATGTC 
TGCAATAATT TCTTCGAGAT GCCCGAGAAC ACCATCAGGG AAAAGACTTT TTGCTGTGGC 
AGCGGTGCCG GCCTTAACGC TGATGAATAT ATGGAGATGC GGATGCGGGG CGGCCTGCCC 
CGGGCCAATG CAGTAAAGTA TGTTCACGAA AAATACGGCG TTAATATGCT GGCCTGCATC 
TGTGCCGTGG ACCGGGCCGT CTTCCCGGCC TTGATGGAGT ACTGGGTACC CGGGGTTGGA 
GTCACCGGCG TCCATGAGCT GGTGGGCAAT GCCCTGGTAA TGAAGGGTGA AAAAGAGAGA 
ACGACTAACC TGCGGGGTGA ACCCTTGCCC GGCAAAGAAG GGGCGGTAGA TGGCGATGTA 
TCGTGA

Protein sequence

MAAIPKPEEL VKINYRPPRT GWMDTPVQFR RGNYLYAAKP KSLEVVGLPN PREWSPEDED 
WKLPENWQEI ILEGLRERLG RFRSLQVFMD ICVRCGACAD KCHFFIGTGD PKNMPVLRAE 
LLRSVYRRDF TTAGKLLGRL VGARDLTVDV LKEWFYYFFQ CTECRRCSLF CPYGIDTAEI 
TMIGRELLNL VGCNIDWIAS PVANCYRTGN HVGIEPHAFK DMVEFCVDEI ENITGIRVEP 
TFNRKGAEVL FIAPSGDVFA DPGTYTLMGY LMLFHEIGLD YTWSTYASEG GNFGMFTSHE 
MMKRLNAKMY AEAKRLGVKW ILGGECGHMW RVINQYMDTM NGPADFLEVP VSPITGTRFE 
NAKSTKMVHI TEFTADLIKH NKLKLDPSRN DNLRVTFHDS CNPARSMGLF EEPRYIIKHV 
CNNFFEMPEN TIREKTFCCG SGAGLNADEY MEMRMRGGLP RANAVKYVHE KYGVNMLACI 
CAVDRAVFPA LMEYWVPGVG VTGVHELVGN ALVMKGEKER TTNLRGEPLP GKEGAVDGDV 
S