Gene Moth_1323 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1323
Symbol
ID	3831033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1368599
End bp	1369930
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	59%
IMG OID	637829259
Product	hypothetical protein
Protein accession	YP_430179
Protein GI	83590170
COG category	[C] Energy production and conversion
COG ID	[COG1625] Fe-S oxidoreductase, related to NifB/MoaA family
TIGRFAM ID	[TIGR03279] putative FeS-containing Cyanobacterial-specific oxidoreductase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.106789
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCACTA AGAGGGGCCG GATAATTGCC GTCCGGCCGG ATAGTATTGC CGCTGAGCTA 
GGAATTAACC CGGGCGATGA GGTGGTAGCC ATCAATGGAG AACCTGTGCC CGACCTCATT 
GCCTACCGTT ACCTCTGTGC CGATGAAAAC CTCCAGGTTG AAATAAAAAA GGCTGATGGC 
GAGACCTGGC TGCTGGATAT TGAAAAGGAT TACGGCGAAG ACCTGGGACT GGAGTTTTCC 
GGTCCAACAT TTGACGGCCT ACGCCACTGC GCCAACAAAT GCCTCTTCTG CTTCGTCGAT 
CAAATGCCCG CCGGCCTGCG GCCGGGCCTT TATATCAAAG ACGACGATTA CCGCTATTCC 
TTCTTACACG GTAATTTTAT CACCCTTACC AACCTGAAAC CAGGGGACTG GGATTATATC 
CTGCGCTGGC ACCTCAGCCC CCTCTATATA TCCGTCCATA CCACCAATCC GGAACTGCGG 
CGGCATATCC TGGGCAACCC TCGGGCTGGA GCCATCATGG ACCAGCTTGG TCGCCTGGCC 
GCAGGCGGTA TCCAGATGCA TACCCAGATT GTCCTCTGCC CGGGGCTGAA CGACGGCCCG 
GAGCTGGAGC GCACGGTCAA GGACTTAAGC CGGCTTTTCC CGGCGGTACA GTCCATCGCC 
GTGGTTCCGG TGGGCCTGAC TGCAGAGCGA GAAGGGCTAT TTCCTTTGAG GCGGGTAACC 
CCGGGCGAGG CCAGGGAAAT AGTGACCCGA ATAGAGGAAT GGCAGTCCAG CTTCCGGCAA 
AGCTTTGGCC GGGGCCTGGT CTACGGGGCC GATGAACTCT ACCTCCTGGC AGGGATACCC 
CTGCCTGCGG CGGCTTATTA TGACGATTTT CCCCAGACAG AGAACGGCAT CGGTATCACC 
CGCCTCTTTC TGGATGAGTA TGAAGTCGCG GTCAAGAAAA TCCCGCGGGC CCTGACCGGG 
CCGCGCCGGG TAGTCGTCGC CACCGGGGTC CTGATAGCTC CTCTCCTGAC CAGGCTGGTT 
CAACGGCTGG TAGCGGGGGT CACCAACCTG GAGGCCAGGG TGGTTGCGGT ACCCAATCGT 
TTCTTCGGGC CAAAGGTGAC TGTAGCCGGG CTCCTCACCG GCCAGGATCT ACTGGCCGAA 
CTGGGGGAGG CCGCCTCCTG GGCCCGGGAA AAGAAGGGCC TGGTTATCCT ACCGGACGTT 
ATGTTGAAAA GCGATGCACC GGTTTTCCTG GACGACCGGA CGCCAGCAAT GCTTGCCAGG 
GAATTAGGAG TACGGGTAGA GATTATCCCG GCTACAGGGG AAGGACTGGT AGCGGGGATA 
TTAGAGGTAT AG

Protein sequence

MPTKRGRIIA VRPDSIAAEL GINPGDEVVA INGEPVPDLI AYRYLCADEN LQVEIKKADG 
ETWLLDIEKD YGEDLGLEFS GPTFDGLRHC ANKCLFCFVD QMPAGLRPGL YIKDDDYRYS 
FLHGNFITLT NLKPGDWDYI LRWHLSPLYI SVHTTNPELR RHILGNPRAG AIMDQLGRLA 
AGGIQMHTQI VLCPGLNDGP ELERTVKDLS RLFPAVQSIA VVPVGLTAER EGLFPLRRVT 
PGEAREIVTR IEEWQSSFRQ SFGRGLVYGA DELYLLAGIP LPAAAYYDDF PQTENGIGIT 
RLFLDEYEVA VKKIPRALTG PRRVVVATGV LIAPLLTRLV QRLVAGVTNL EARVVAVPNR 
FFGPKVTVAG LLTGQDLLAE LGEAASWARE KKGLVILPDV MLKSDAPVFL DDRTPAMLAR 
ELGVRVEIIP ATGEGLVAGI LEV