Gene Moth_1629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1629
Symbol
ID	3831258
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1664993
End bp	1666060
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	63%
IMG OID	637829554
Product	hydrogensulfite reductase
Protein accession	YP_430474
Protein GI	83590465
COG category	[C] Energy production and conversion
COG ID	[COG2221] Dissimilatory sulfite reductase (desulfoviridin), alpha and beta subunits
TIGRFAM ID	[TIGR02066] sulfite reductase, dissimilatory-type beta subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.501606
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATG ATCTGCCGGC CGGGATTATG CCCGACTACC GCCAGCAGAT ACCACCAGAA 
CTCCTCGCCT GCCGGGGAAA GTGGGTCAGG CATGAAATGG TCCGGCCAGG AGTGATCCGT 
CATCTGGCCG GCGATGGTAC CGCCATCCTG ACGGTCCGCA TTTTACTGCC ACCCAACGGC 
CTGTTGAGCG CGGCTACCCT GCGTCAGCTG GCCCGCTGGA TCCGGGTTTA TGCCCTGACT 
GGCCGGCGCA CCAGCCGCCA GGGTTTCGAG TTTGTCGGCG TCCGGCCGGA ACTCCTGGAT 
AACTTCCTGG CCGAGCTGGC GGCGAGCGGT TTTCCGGCCG GGGGTACTGG TAATAGTCTG 
CACCAGATTA AGTGCTGTAC CTCCTTCATC CATTGCCAGA ATGCCGCCGT CGATGCGCCC 
AGCATCGCCA AAACCCTGGC GGACTATTTG TACCCGGCGT TTTTCCACCA GGACCTGCCG 
GCACCGCTGA AGATATCGGT AACCGGCTGC CCCAACCAGT GTGGCGGCGG TGTCGAGGCG 
GACATCGGCA TATCCGGATA TTTTGCCACC GTACCCAGGG TGGACGACGC CGGCCTGATG 
GCAGCCAATA TCGACTTCGG CCACCTGATC TCCGGTTGCC CGGTAGGGGC CATTCGTCCC 
CGGCAGGTCG AGGGCGGGAC GACAGTGGTT ATTAACGCCG AACGTTGCAT CCGCTGCACC 
TCCTGTATCC AGGTGGCGCC TGAAGGGATA AAGCCCGGCC CGGAGCGCTT TGTCGCCATC 
GCCGTCGGCG GCCACGGCGG TAATAACCGG CGGGGCCCAG AAATGGCAGC CGTGGTGTTT 
TCCCGGGTAC CGGCCAGGCC CCTGGACTAC GCGGCCATTT GCGAACGGGT GCAACGGATT 
ATCGCCTGCT GGCGGGACAG GGGGAAACGC GGGGAAAGGC TCGCCGGCTT CCTGGAACGC 
CTTGGCTGGC CGGCTTTTCT CAAGGCCGTA GGGGCTAGCC CGGTAGCAGA CATTTTTGAT 
AACCATTTCC CCTTTGCCGG CCTACGCCGG GACCTGCACC TGCGGTAG

Protein sequence

MKNDLPAGIM PDYRQQIPPE LLACRGKWVR HEMVRPGVIR HLAGDGTAIL TVRILLPPNG 
LLSAATLRQL ARWIRVYALT GRRTSRQGFE FVGVRPELLD NFLAELAASG FPAGGTGNSL 
HQIKCCTSFI HCQNAAVDAP SIAKTLADYL YPAFFHQDLP APLKISVTGC PNQCGGGVEA 
DIGISGYFAT VPRVDDAGLM AANIDFGHLI SGCPVGAIRP RQVEGGTTVV INAERCIRCT 
SCIQVAPEGI KPGPERFVAI AVGGHGGNNR RGPEMAAVVF SRVPARPLDY AAICERVQRI 
IACWRDRGKR GERLAGFLER LGWPAFLKAV GASPVADIFD NHFPFAGLRR DLHLR