Gene Moth_0292 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0292
Symbol
ID	3832954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	298125
End bp	299192
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	36%
IMG OID	637828227
Product	hypothetical protein
Protein accession	YP_429169
Protein GI	83589160
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00116575
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTAACG ATTTATATCC TCTATTAGGA CAAGGAGAAA GACTGATAGA ACCTATAACA 
CCTGGGCAAA GGTCTGCGAA AAAGAGTTTT CCCAGAACCT ATGAAGAGGC GCGAGAACTT 
ATTAAAAACC AGCTAAAAGA TTTGAGATAT GAAATCGATA ATATACCGCA ACAGAAAAGA 
GTGGAACAAA TAATATTTAC AGTTAGGCTT AACCATAATT TCCTTGCTAA ATCATATATA 
CCTAACACTT TTTTTTATCA AACTGGAATG GAGAATATAG GGTCAAGGCG ATGGATTTAT 
AAGGAATCCA ATAAAGAGAA ACCTCAACTT AGTAAACTTC ACTTTGTGAG AGCCGAAATC 
AGTAATCTAG CCATTTTAGA GGAAAAACTA AACACTCAGG AGAGTAGGCT TAGTGAGGCT 
TTTAAACAAG ATATACAAAA AATTGAAAAG CTGTCTCTCC TTTCTCCCGA AGAAGCAATT 
CAGGGGTTTA ACGACGATTG GCAAACAGGT AAAGTGGAGA TTGTCTTACA TCCGTTAAAA 
GATAGTTCAG AAGAAGCAGT AAGAAAGTTG AAGGATATTT TATTGGCTAA TGGGGTAAAA 
GAAAAATCTA TATTAATTAG GCACTATCCT GGGGGGCCAA CATTTATAAG TGCTAACATA 
ACCAGAAAAG CATTACAAGA AATTGGGGAT TTTAATCCTT TGAGAACGGT TCATCCTTTA 
AAGATAAACT TTTTCCCTGA ACTCAGGAAA ATAGGCTCAT TTCCTATAAT ACCTACCCCT 
CCCGTAGGAA AAACAATATC AACAATAAAG GTTGGTATAT TTGATGGGGG GATAGATGCT 
ACAAATCCTT ATCTTGCAAA CTACGTAAAA GAAAATTCCC TAATAAAAAC CAAGCCTCAT 
CCTACCTATA TAACTCATGG TACTGCAGTT GCTGGGGTAG TCTTATATGG CCCATTAAAT 
AACTATGATA ATAATACAGT TTTGCCTAAT CCGTTCGGAT TAACCCCCGC AGATTGGACA 
TATGCACCCG ACATTAAGCT CTCTTGCAAT TTTTCTTCAA GCTTTTAA

Protein sequence

MPNDLYPLLG QGERLIEPIT PGQRSAKKSF PRTYEEAREL IKNQLKDLRY EIDNIPQQKR 
VEQIIFTVRL NHNFLAKSYI PNTFFYQTGM ENIGSRRWIY KESNKEKPQL SKLHFVRAEI 
SNLAILEEKL NTQESRLSEA FKQDIQKIEK LSLLSPEEAI QGFNDDWQTG KVEIVLHPLK 
DSSEEAVRKL KDILLANGVK EKSILIRHYP GGPTFISANI TRKALQEIGD FNPLRTVHPL 
KINFFPELRK IGSFPIIPTP PVGKTISTIK VGIFDGGIDA TNPYLANYVK ENSLIKTKPH 
PTYITHGTAV AGVVLYGPLN NYDNNTVLPN PFGLTPADWT YAPDIKLSCN FSSSF