Gene Moth_0209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0209
Symbol
ID	3831360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	204139
End bp	205698
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	60%
IMG OID	637828145
Product	hypothetical protein
Protein accession	YP_429087
Protein GI	83589078
COG category	[S] Function unknown
COG ID	[COG1297] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAAAGC ACCCCAGGGC ATTTGAACCA GCCGTCCTCA TCCTCAATAT TATTCTCTCG 
GTATTGGGGT CGATTATCGG TCTGCAGATC CTTACTACCC TGGGGGTCAC ACCCAACACG 
GCCATCATTG GGGTACTGGT AGCCCTCGCC CTGTCGCGCA TCCCGGGAGG GTGGATGGCC 
AAATACCGTT CCATTCACCG CCAGAACCTG GTCCAGTCGA CCATTTCCGG CGCCACCTTC 
GGGGCAGCCA ACTCCCTGCT GCTGCCTATC GGCATTCCCT ACCTCTTCGG CCGTCCCGAC 
CTGGTTGTGC CCATGCTCAT AGGAGCGACC ATGGGCATGT TCATTGACTG GGCCATGCTG 
TACTGGTTCT TCGATTCCCG GATTTTCCCC GGCCAGGCCG CCTGGCCGCC GGGTGTGGCG 
GCAGCCGAAG CCATCTATGC CGGTGATGAA GGCGGCAAGA GGGCCTGGTT ACTCGTCTGG 
GGCACCATTA TCGGGATCAT TGGTTCTTAC TTCAAGGTTT CCATGTCCGC CTTCGGGGTG 
GCCTTTATCG GCAATGTCTG GGCTTTGACC ATGTTTGGCC TTGGGCTGCT GCTGAGGGGT 
TATTCTGTAA AACTCTTTGG CTTTGATATT GATAAACTCT ATATCCCCCA CGGGATGATG 
ATTGGAGCCG GTCTGGTGGC CGGAATCCAG ATATTGCTCA TTCTTCTAAA GGGAAGGAAA 
GAAACGACGG CTTCCGGGGA TGCCCCTGCG GCCGCTAACT ATACGCGGAG TGAAAAACAG 
GTCGCTAAAG GCCTGGCCCG GGGTTTTGGC CTCTATATCG TCGCAGCCCT GGTCCTGGCC 
ATGCTGGGCG GCCTCTACAC CAGCATGCCG GCGTGGCAGT TGCTGTTCTG GGCCGTTTTC 
GCCGCCGTTT CCTGCATCCT GGCTGAGTTT ATCGTGGGGC TTTCAGCCAT GCACGCCGGC 
TGGTTCCCGG CCTTTGCCAC GGCCCTGATT TTCCTGGTCA TCGGCATGGC CCTCGGCTTC 
CCGGCCCCGG CCCTGGCCCT GCTGGTGGGC TTTGTCGCTT CGGGGGGGCC GGCCTTTGCC 
GACGCCGGTT ATGATTTTAA GGCCGGCTGG ATCCTCAGGG GTGAAGGCCG GGATCGCGGT 
TTTGAGCTTG ACGGCCGCTG GCAGCAGTTC CTGGCAGGTG CTTCAGGCCT GGTCGTGGCC 
TGGGCCATGG TCACCCTGAC CCACGGTATC TATTTCCGCC AGGGCCTCTT CCCGCCGGTG 
GATAAGGTTT ACGCGGCGAC CATCAAAGCG GGGGTAGACG CGGCTATCAT CAAAAATCTG 
GTCCTGTGGG CCATACCCGG AGCCCTGATT CAGGCCCTGG GCGGTTCTGA AAAACAGCTG 
GGCATCATGC TGGCCACCGG CCTTTTAATC CTCAATCCCC TGGCGGGTTA TGCCGTGCTG 
GCGGGGATTT TGATCCGCAC CCTGGTTTTG AAGTTTAAGG GGCGGGAAGC GGAGACCCCC 
ATGACCATCC TGGCAGCTGG CTTTATCGCC GGCGATGCCC TCTACGGTTT CTTTAACTAG

Protein sequence

MEKHPRAFEP AVLILNIILS VLGSIIGLQI LTTLGVTPNT AIIGVLVALA LSRIPGGWMA 
KYRSIHRQNL VQSTISGATF GAANSLLLPI GIPYLFGRPD LVVPMLIGAT MGMFIDWAML 
YWFFDSRIFP GQAAWPPGVA AAEAIYAGDE GGKRAWLLVW GTIIGIIGSY FKVSMSAFGV 
AFIGNVWALT MFGLGLLLRG YSVKLFGFDI DKLYIPHGMM IGAGLVAGIQ ILLILLKGRK 
ETTASGDAPA AANYTRSEKQ VAKGLARGFG LYIVAALVLA MLGGLYTSMP AWQLLFWAVF 
AAVSCILAEF IVGLSAMHAG WFPAFATALI FLVIGMALGF PAPALALLVG FVASGGPAFA 
DAGYDFKAGW ILRGEGRDRG FELDGRWQQF LAGASGLVVA WAMVTLTHGI YFRQGLFPPV 
DKVYAATIKA GVDAAIIKNL VLWAIPGALI QALGGSEKQL GIMLATGLLI LNPLAGYAVL 
AGILIRTLVL KFKGREAETP MTILAAGFIA GDALYGFFN