Gene Moth_1539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1539
Symbol
ID	3831925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1582320
End bp	1583399
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	62%
IMG OID	637829471
Product	peptidase M24
Protein accession	YP_430391
Protein GI	83590382
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0730424
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCCAGCA GATTAACCCG GCTGCGGGAG CTCATGGAGC GGGAAGGGAT TACCGCCCTC 
TGGGTGCACC AGGACGAAAA CCGCCGCTAC TTAAGCGGTT TTACCGGCGA CAGCGGCACC 
CTACTCATTA CCCCCACAGC CCAGTACCTG TTAACCGACG GCCGCTTTAC AGAGCAGGCC 
CGGGAAGAAG CGCCGGACTT TCAAATCATC GACCTGGGCC CGCATCCATG GGAGCAACTG 
GGCCAGACCC TGGCCGCCGC CGGCATAGAG AAACTCTTTT TTGAAGCCGA GCACTTGACC 
TATGCCACCT ACGAAGAATT CCTAGAGAAA GCCAGGGACT GGCCGCGGCC CGTCAGCCTG 
GCGCCGGTGA AGGGCCTGGT AGCCAGGCTG CGCCAGGTGA AAGACGCGGA GGAAATCGCC 
GTCCTGGAAA AGGCCATTGC CATAGCTGAC GCCGGCTACA ACCACCTATT AAGTATCCTG 
CGTCCCGGCC TTACCGAGCG GGATATAGCC CTGGAACTGG AGTATTTTAT GGGTAAGCAG 
GGTTCCAGGG GGCCGTCCTT TACCACCATT ATCGCCAGTG GGCCCCGGTC GGCCCTGCCC 
CACGGGGTGG CCTCGGACCG GGTCCTGCAA CCGGGAGACA TGATAGTCAT GGATTTTGGC 
GCCGTTTATG GCGGCTACCA TTCCGACCTG ACGCGGACGG TGGCCCTGGC CCCGGTGACA 
GCCGAATGGC GGCGCCTCTA TGATATTGTC CTGGAGGCCC AGCAACAGGC CATAGCCGCC 
CTTCGCCCCG GGATTCAAGG CAGAGAAGCT GATGCCGTGG CGCGGGAGGC TATTGCCGCT 
GCCGGATATG GCGATTATTT CAGCCACGGC CTGGGACATG GAGTCGGCCT GGCCATCCAC 
GAAGACCCCA CCCTCTCAAG CCGGAGCGAG GTCAAACTGG CTCCGGGGAT GGTAGTCACG 
GTGGAACCGG GTGTTTACCT CCCGGGACGG GGGGGCATCC GCATCGAGGA TGTTGTTCTC 
ATCCAGGAGG GAGGCGCTCG GGTCCTCTCC CGCGCCCCCA AAGAGTTTAT TGAGCTGTGA

Protein sequence

MSSRLTRLRE LMEREGITAL WVHQDENRRY LSGFTGDSGT LLITPTAQYL LTDGRFTEQA 
REEAPDFQII DLGPHPWEQL GQTLAAAGIE KLFFEAEHLT YATYEEFLEK ARDWPRPVSL 
APVKGLVARL RQVKDAEEIA VLEKAIAIAD AGYNHLLSIL RPGLTERDIA LELEYFMGKQ 
GSRGPSFTTI IASGPRSALP HGVASDRVLQ PGDMIVMDFG AVYGGYHSDL TRTVALAPVT 
AEWRRLYDIV LEAQQQAIAA LRPGIQGREA DAVAREAIAA AGYGDYFSHG LGHGVGLAIH 
EDPTLSSRSE VKLAPGMVVT VEPGVYLPGR GGIRIEDVVL IQEGGARVLS RAPKEFIEL