Gene Moth_1168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1168
Symbol
ID	3833102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1199708
End bp	1200691
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	59%
IMG OID	637829101
Product	nitrite and sulphite reductase 4Fe-4S region
Protein accession	YP_430025
Protein GI	83590016
COG category	[C] Energy production and conversion
COG ID	[COG2221] Dissimilatory sulfite reductase (desulfoviridin), alpha and beta subunits
TIGRFAM ID	[TIGR02912] sulfite reductase, subunit C

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00249386
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATAATA CGAAAGAATT GATCAAGAAC GCCTACCGCA TTACCAGCCG CAGGGGTTAT 
ACGGCCCTGC GTCTCCGGGT GCCCGGCGGG CACCTGGCGG CCGAATATTT AGGCTTAATC 
CAGGATATAG CCCGGCGCTA CGGCAACGGT ACCGTTCATC TGACTACCCG CCAGGGTTTT 
GAAATCCCCG GCATACCCCT TGACAAAGTA CCGGAGGTAA ACCAACTGCT GGCACCTATG 
TTGCAACAAG AGGCCGCCCT GGGAGTGGCC ATCGAGAATA TCCATGCCGG TTACCCGGCG 
GCGGGCACCC GGAACGTCAC GGCCTGCATT GGCAGCAGAG TCTGCCCCTT TGCCAACTTT 
GACACCACGG CCCTGGCGCA AAAAATCGAA GGTCTCATCT ATCCCAACCA CTACCACGTC 
AAGATTGCCA TTACCGGTTG CCCCAACGAC TGCATCAAGG CCCACCTCCA GGACATCGGC 
ATCATCGGCC AGGTGGAGCC GGAGTATGAT CCCGGCCGCT GTATCGCCTG CCAGGCTTGT 
GTCAAGAACT GCCGCCAGTT TATCGTCGGC GCCCTGGAGC TGGTCAATTA CCAGGTGGAA 
CGCGACGGCA AGCGCTGCCT GGGCTGCGGC GAGTGTATCC TGCAATGTCC CATGGCGGCC 
TGGACCAGGG GGCGCCAGTA CTACCGGATC GTGGCCCTGG GTCGCACCGG GAAAAAGAGC 
CCGCGCCTGG CGGCCAACTT CCTGGAATGT ATTGATGAAA AGGCCGTCCT GCAGGTAATC 
GCCAACCTGT ACCGTTATAT TGAGCGGCAC ATTGATCGCT CCCTGCCCAA GGAGCACGTT 
GGCTATATCG TCGACCGCAC GGGCTACCAG GTCTTTAGGG ATGAACTCCT GGATGGTGTT 
GATCTGGGTC CGAAAGGCCG GGTGGCCCGG GAATTGCCCT TTTACGGCTA CAGCTACGAC 
CGCGACTTGC TGTGGAGCAA ATAG

Protein sequence

MYNTKELIKN AYRITSRRGY TALRLRVPGG HLAAEYLGLI QDIARRYGNG TVHLTTRQGF 
EIPGIPLDKV PEVNQLLAPM LQQEAALGVA IENIHAGYPA AGTRNVTACI GSRVCPFANF 
DTTALAQKIE GLIYPNHYHV KIAITGCPND CIKAHLQDIG IIGQVEPEYD PGRCIACQAC 
VKNCRQFIVG ALELVNYQVE RDGKRCLGCG ECILQCPMAA WTRGRQYYRI VALGRTGKKS 
PRLAANFLEC IDEKAVLQVI ANLYRYIERH IDRSLPKEHV GYIVDRTGYQ VFRDELLDGV 
DLGPKGRVAR ELPFYGYSYD RDLLWSK