Gene Moth_1633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1633
Symbol
ID	3831262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1668041
End bp	1669420
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	55%
IMG OID	637829558
Product	hypothetical protein
Protein accession	YP_430478
Protein GI	83590469
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAG TCTTTGACGA TTACCGGGTG CTCTCAGATG AGACCCTGAA ACCAGACGCG 
CCACGGGTGG AAAAATTCCT CCAGGCCATG GGGAAATCCC TCCGGCAGCG GGATAACTGG 
ACCTTTTGGC TCCCCTATAC CCTATCCCTG GATACCTGCA TGAAGTGCGG TACCTGCGCC 
GAGGTCTGCC CGGTCTACCT GGCCAGCGGC CGCAAAGACA TCTACCATCC GGTCTACCGT 
TCCGACATGC TGCGTAAGGT TTATAAACGG TATTTTACCC TGGCAGGAAG GTTTTTTCCG 
GGCCTGGTGG GAGCGGAAGA CCTGACGGAA GATAAACTCA ATGCCATGGC CGAGAATATT 
TACCGGTGTA CCATTTGCCG CCGCTGTGCC TATGTTTGCC CGGTAGCCAT TGATAACGGC 
TTGATTGCCC GGGAAGCACG GAAAATCTTC GACGCCATCG ATATCGCCCC CGACGAGCTG 
AAGAAAAACG GCACCCGGAA ACAGGTCCGG CTGGGTAACG CCACCGGTAT GCCGGCCAAC 
GCCTTTTTTG ACATGATTGA GTTCCTGGAG GAAGAGATTG AGGATACACG GGGATATAAA 
ATTAAAATAC CGGTTGATAA GCAGGGCGCC GAGTACCTCC TCATGCATAA CGCCGGCGAC 
TACCTGGCCT TTGCCGAGAC GGTAATGGGC GCCGCCGAAG TCATGAACGC CGCCGGTGTC 
GACTGGACCC TCAATTCCCC GGAAACGGGC CTCAACGATG CCGTCAATTA CGGCGTCTTT 
TACAGCGATA CCGAGTTCGC CAGTGTTGCC AGGGCCCATA TCGAAACTGC CAAAAAGTTA 
GGGATTAAGA CTTTCGTCGT AGGCGAGTGC GGTCATGCCT TCGAGGCGCT GAAGTACCTG 
ATCTTGCGCC TCGTCCCCCC GGAAGAAAGG CCTTTTGAGG TCAAGAGCAT CCTGGAACTG 
GAGGATCAAT GGATCCGGGA AGGGCGGATT AAGGTCGACC CCCAGAAGAA CCCTGAACCT 
GTGACCTACC ATGATTCCTG CAAGCTGGGC CGCCTGGGAG GGCTCTATGA GGAGCCGCGG 
CGCATCCTCA AAGCCTGCTG CACTGATTTT CGCGAAATGA CGCCCAACCG GGAAATGAGT 
ATTTGCTGCG GCGGTGGCAG CGGTTTTGCC ATTATGGATA AGGGCGACTT CCTTAAATTC 
CGCATGGAAA CCTACGGTAA GCTCAAAGCC GAGCAGCTAA AAGCCACCGG CGCCAGCATT 
GTAGCCCTGG CCTGCTCCAA TTGTAAGGGC CAGTTCCGGG AGATTATCAA CTACTATAAG 
CTGCCGGTAC GTTTCATGGG TGTCAGTGAG CTGGTGGCTA ATGCCCTGGT GTACAATTAA

Protein sequence

MRKVFDDYRV LSDETLKPDA PRVEKFLQAM GKSLRQRDNW TFWLPYTLSL DTCMKCGTCA 
EVCPVYLASG RKDIYHPVYR SDMLRKVYKR YFTLAGRFFP GLVGAEDLTE DKLNAMAENI 
YRCTICRRCA YVCPVAIDNG LIAREARKIF DAIDIAPDEL KKNGTRKQVR LGNATGMPAN 
AFFDMIEFLE EEIEDTRGYK IKIPVDKQGA EYLLMHNAGD YLAFAETVMG AAEVMNAAGV 
DWTLNSPETG LNDAVNYGVF YSDTEFASVA RAHIETAKKL GIKTFVVGEC GHAFEALKYL 
ILRLVPPEER PFEVKSILEL EDQWIREGRI KVDPQKNPEP VTYHDSCKLG RLGGLYEEPR 
RILKACCTDF REMTPNREMS ICCGGGSGFA IMDKGDFLKF RMETYGKLKA EQLKATGASI 
VALACSNCKG QFREIINYYK LPVRFMGVSE LVANALVYN