Gene Moth_1603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1603
Symbol
ID	3832749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1639124
End bp	1640281
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	53%
IMG OID	637829532
Product	polysulphide reductase, NrfD
Protein accession	YP_430452
Protein GI	83590443
COG category	[C] Energy production and conversion
COG ID	[COG5557] Polysulphide reductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00601969
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGCCA GGGCTTTTAA CGGCAGCAAA AGGTACTGGA GCTGGGTAGT ATTCCTGCTA 
GTCCTGGCCG GCATAGGGTT CGCCTGTTAC CTGGTCCAGT TCAACCGGGG CCTGACAGTT 
ACCGGTATGA GCCGGGACGT TTCCTGGGGC CTGTATATTG GCCAGCTAAC CTTCCTGGTA 
GGGGTGGCCG CTTCGGCAGT AATGCTGGTG CTGCCCTACT ATCTTCATAA TGTCAAAGCC 
TTTGGGCGTA TTACTATCCT GGGGGAGTTC CTGGCGGTGG CCACCATCAT CATGTGCTTA 
CTCTTTGTTT TCGTCGACCT TGGGAAACCC ATGCGCCTGC TGAACATGAT CCTCTACCCG 
ACCCCCAACT CCATCCTCTT CTGGGATATG GTTGTGTTAA CTGGTTACCT CCTTCTCAAT 
ATTGTCATCG GCTGGACCAT GCTGGAAGCG GAATATAAGA CGGTAGCCCC GCCAAAATGG 
GTTAAGATTT TGATCTATAT ATCCATCCCC TGGGCCATCA GCATCCATAC GGTTACGGCT 
TTTCTTTACG CCGGCCTGCC GGGGCGCCAT TACTGGCTGA CAGCCATTAT GGCCGCCCGC 
TTCCTGGCCT CGGCCTTTGC CTCGGGTCCG GCCCTGCTGA TTGTCCTGTG CTTCATTATC 
AGGAAGGTCA GCAAGTTTGA CCCCGGCCGT GAGGCTATCG ACAAGCTGGC AGCCATCGTT 
ACCTATGCCA CCATTATCAG CGTCTTCTTT GTGGGCCTGG AATTCTTCAC TGCCTTTTAT 
AGCCAGGTTC CGGCCCATGG TATGGATAGC CTTATCTATC TCTTTGCCGG CCTGGATGGC 
CATGCTAAAT TAGTTCCTTT GATGTGGCTG TTTGCCGTCC TGGCTGTAAT AGCCCTTGTT 
TTGCTAATCA ATCCCCGCAC CCGGAACAGG GAGGCTACCC TGATAGCCGC CTGCGGCGCG 
GTATTTATCT CCATGTGGTT GGAAAAGGGT ATTGGTTTGG TAATCGGCGG CTTTATTCCC 
AACGCCTTCA ACCGGGTGAC GGAATACAGC CCTACTCCCC TGGAGATGTT GATCACCCTG 
GGTATCTGGG CCGTCGGGGC CCTCATCCTG ACTTTTCTTT ATAAAATTGC TATTGCGGTT 
AAAGAAGATT TGCTTTAA

Protein sequence

MIARAFNGSK RYWSWVVFLL VLAGIGFACY LVQFNRGLTV TGMSRDVSWG LYIGQLTFLV 
GVAASAVMLV LPYYLHNVKA FGRITILGEF LAVATIIMCL LFVFVDLGKP MRLLNMILYP 
TPNSILFWDM VVLTGYLLLN IVIGWTMLEA EYKTVAPPKW VKILIYISIP WAISIHTVTA 
FLYAGLPGRH YWLTAIMAAR FLASAFASGP ALLIVLCFII RKVSKFDPGR EAIDKLAAIV 
TYATIISVFF VGLEFFTAFY SQVPAHGMDS LIYLFAGLDG HAKLVPLMWL FAVLAVIALV 
LLINPRTRNR EATLIAACGA VFISMWLEKG IGLVIGGFIP NAFNRVTEYS PTPLEMLITL 
GIWAVGALIL TFLYKIAIAV KEDLL