Gene Moth_2231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2231
Symbol
ID	3831276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2325439
End bp	2326674
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	50%
IMG OID	637830151
Product	RNA-directed DNA polymerase (Reverse transcriptase)
Protein accession	YP_431061
Protein GI	83591052
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.00000000756298
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

TTGACAACGA AACTTGCAAG AATAGCGGAA GTTGCCCGAA CGCGACCGAA GGAACGCTTT 
ACCTCCCTCA TGCACCTAAT AGATGCGGAT ATGCTAAGGA TATGCCATGT TGAGCTCAAG 
GCCAATAGGG CTACCGGCAT AGATGGCATT ACCAAGGAGC AATATGGCGA CAACCTGGAA 
GCTAACATTC AAAGCCTCCT AGAACGCCTC AAACGCAAAG CTTACCGGCC CCAACCAGTT 
AGGCGAGTCT ATATTCCCAA ACCGGGCTCT GACAAGAAGC GCCCCCTGGG GATACCAGCC 
TACGAAGATA AAATAGTCCA ACTGGCTGCC AGTAAGATCC TCAATGCCAT CTACGAAGCG 
GAATTCCTGG ATATGTCCTT CGGCTTTCGC CCCCAACGCG GCTGCCACGA TGCCCTAAAG 
TTATTAAACT ACCTCATCGT CGCCAGGAAG GTCAACTATA TAGTCGATGC TGATATCAAA 
GGCTTCTTCG ACCATGTAAA CCACGACTGG CTGATGAAAT TCTTGGGGCA TCGCATAGCC 
GACCCCAACT TTCTTCGGTT TATCCGTCGA TTTCTCAAGG CGGGCATTAT GGAGAACGGG 
GAACTAAGGG ACGCAACCGA AGGGACACCC CAGGGCGGCA TAGTATCGCC TATCCTGGCC 
AACATCTATC TGCACTATGT CCTTGACCTG TGGTTCGAAA AAGCGGTGCG CAAACACTGC 
CGGGGAGAAG CCTATATGGT GCGCTATGCC GATGACTTCA TCTGCTGTTT TCAATACAAA 
CATGAGGCCG AGGCATTTTA CCGGGCACTG AAAGCAAGGC TGGCCAAATT TTCCCTATCC 
GTAGCCGAAG AAAAGACCAA GATAATTCCC TTTGGCCGCT TCGCTACCCA ATGGTGCAAA 
CGGATGGGGC AAAATAAGCC AGATACCTTT GATTTCCTGG GCTTTACCCA TTATTGCAGC 
ACCAGCCATC AGGGCAAGTT CAGGGTCAAG AGACGCACCA GCCGGAAGAA GTTCCGGCAG 
AGCGTGCAGA GAATGAAGGA ATGGATAAAA GGGAACCGCA TGATGCCAGC GAAAGTGCTC 
ATGGCCCTTC TCAAAAGGAA ACTCGAAGGT TATTACCACT ATTATGGGAT AACCGATAAC 
AGCAAGCGCA TCCTGGCATT CCACTACATT GCCAGGTGTA TGCTCTTCAA GTGGCTAAAT 
CGTAGGAGCC AGAGGGTTAG TGTAAAATTA CAGTAG

Protein sequence

MTTKLARIAE VARTRPKERF TSLMHLIDAD MLRICHVELK ANRATGIDGI TKEQYGDNLE 
ANIQSLLERL KRKAYRPQPV RRVYIPKPGS DKKRPLGIPA YEDKIVQLAA SKILNAIYEA 
EFLDMSFGFR PQRGCHDALK LLNYLIVARK VNYIVDADIK GFFDHVNHDW LMKFLGHRIA 
DPNFLRFIRR FLKAGIMENG ELRDATEGTP QGGIVSPILA NIYLHYVLDL WFEKAVRKHC 
RGEAYMVRYA DDFICCFQYK HEAEAFYRAL KARLAKFSLS VAEEKTKIIP FGRFATQWCK 
RMGQNKPDTF DFLGFTHYCS TSHQGKFRVK RRTSRKKFRQ SVQRMKEWIK GNRMMPAKVL 
MALLKRKLEG YYHYYGITDN SKRILAFHYI ARCMLFKWLN RRSQRVSVKL Q