Gene Moth_1771 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1771
Symbol
ID	3831063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1825826
End bp	1826929
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	60%
IMG OID	637829696
Product	peptidase M24
Protein accession	YP_430615
Protein GI	83590606
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0652129
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACAGCAC GTTATGCCAA CCGTATTGAG AAGGCCCGGG AACTGATGAT AGAAAAAGAC 
CTGGATCTGC TCTTTGTGGT CAACCGGGAG AACCTGATTT ACTTTACCGG CCTGACCCAG 
ATCGAGTGCC TGGCCGTGCT TATCCCCAGG GAGGGAGAAC CATGTGCTGT GACCCTCTGG 
CTGGATGCTG ATTATGTAGA ACGGGAGTCA GGGCTCACCA CCTATGGCTA TTACTTTCCG 
CGGGAGAGCC TGGCCAGCAA AGTTGTGGAA CGCATCAAGG CCTATGGTTT CAAGGTACCG 
CGTATAGGTT TTGAACGCTA CTTTGTCGAT TTTGCCGTCT ACGACGGCCT GCGCCGGGCC 
TTTCCGGAGG CCAGCTTTAC CGGGGCAAGC GATCTCTTTT ATCGCCTTCG CTCCATTAAA 
GAACCAACGG AAGTAGAACT CCTGCGGCGG GCGGCGGCGG CCGCCTGCCG CGGCATGGAA 
GCGGCCATCA AAAGCGTCCG GCCGGGGGTC ACGGAGCTGG ACATCCTGGC CGAAGCGGAA 
TACGCCATGT TGAAAGCAGG CTCAGGTGGG TCTTCCTTCC GGCCTCAGGT GGTCTCTGGG 
GAACGGGTCC TCCTGACCCA CCCCTGTGCG AGCAATAAAA AGATTGCGCC GGGGGAGGCG 
GTGGTCATCC ACCTGGGCGC GACTTACGAG GGTTACTGTG CCAAGATGTG CCGGACCGTG 
GCTGTAGGCC GGATCCCTCC GGAGCAAGAA AATATCTACT ATCTCCTGCT GGAGGCCCAG 
GGCCGGGCCA TAGCCGCTTT AAGGCCCGGG GTCACGGCAG GGACGGTGGA TGCCGCCGCC 
AGGCAGGTTG TAGAAGTCGC CGGCTATGGC GATAGTTACC TGGAGGTGGT GGGTTACGGC 
GTGGGCCTGC GCCAGTCGGA GTTCTACCCC ATTGTCGGTA GAGGGCGGGA GGAGGTTATC 
GAGGCCGGCA TGGTAGTAGA CCTGCTCCTG CCGACCATCT ACCGTCCCGG CATTGGCGGG 
CCCAGGGTGA CGGATGTTAT CTATGTCGGC CGGGAAAAGA ACGAGATCCT GACGGATTAC 
CCGCGGGAAC TGGTACGGGT GTAG

Protein sequence

MTARYANRIE KARELMIEKD LDLLFVVNRE NLIYFTGLTQ IECLAVLIPR EGEPCAVTLW 
LDADYVERES GLTTYGYYFP RESLASKVVE RIKAYGFKVP RIGFERYFVD FAVYDGLRRA 
FPEASFTGAS DLFYRLRSIK EPTEVELLRR AAAAACRGME AAIKSVRPGV TELDILAEAE 
YAMLKAGSGG SSFRPQVVSG ERVLLTHPCA SNKKIAPGEA VVIHLGATYE GYCAKMCRTV 
AVGRIPPEQE NIYYLLLEAQ GRAIAALRPG VTAGTVDAAA RQVVEVAGYG DSYLEVVGYG 
VGLRQSEFYP IVGRGREEVI EAGMVVDLLL PTIYRPGIGG PRVTDVIYVG REKNEILTDY 
PRELVRV