Gene Moth_0247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0247
Symbol
ID	3833210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	250230
End bp	251393
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	61%
IMG OID	637828183
Product	C-terminal processing peptidase-3
Protein accession	YP_429125
Protein GI	83589116
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCGAGGA TCTGGCGTCA GATCGGCCGC GGGCTTCTAG CCCTCTGCGT GTTGGTGACC 
CTGGCCGTGG GAGTGGGGGT GGCTACCCAC TTCCGGGAAG TGGAGCAGGG TGTTAAGACC 
TACGCCCTGC TGCGCTTCCA GGCCTTGCAG CCTATCAGCA CTGATAAACT CATGGAAGGG 
GCCATCAGGG GTATGGTTGA AGCCCTTGAT GACCCTTATT CTACTTACCT GGACGCTGAA 
ACCTACCGCA AATTGCAGGA GAGCGTCACC GGCAGTTACG GCGGGGTCGG CCTGCTGATT 
ACCCTGGATG AAAAGGACAA GCGGGTGGTG GTCGTTTCTC CCTTTAAAGG AACGCCGGCC 
CAGCGGGCCG GGATTAAAAG CGGGGATTAT ATCACGGCCA TCGACGGCCG CGATACCACC 
GGCATGGACC TGGAGACGGC CTCGAACCTT ATGCAGGGCG AGCCGGGTAC CAGGGTGGAG 
CTGACCATCC TGTCTGCGGG CGACAGCAAC CCCAGGAAAG TCGCCCTCAC CCGGGAGATT 
ATCAAGGTAC CGACGGTGGA CGGCAGGATG CTCCCCGGGC ATCCGGGGGT CGGATATATC 
AGCGTGACCA TGTTTAATGA ACAGACAGGA GCCGACCTGG GGCGGGAGTT AAACGACCTG 
CGCCAGCAGG GTATGCAGAA GTTAATTCTG GATCTGCGCA ACAACCCCGG CGGCGCCCTC 
CCGGCGGCGG TGGATGTGGC CAGTTACTTT GTACCCCAGG GGCCGGTAGT CTATATCGCC 
GACCAGAAAA CCAGCGAGCC CCTCATGGCC CGGGGGTATG CTCAACCCCT TCCCCTGGTT 
GTCCTGGTGA ATAAAGGCAG CGCCAGCGCG GCGGAGATTG TGGCCGGGGC CATCAAGGAT 
ACGAAGAGCG GCACCCTGGT AGGCGAGACG ACCTTCGGCA AGGGCATCGT CCAGACCATC 
TTTCCCTTGC CCGGCGATGC GGCGGTGAAG ATCACCACCC AAAAATACCT GACTCCGGGC 
AAGCACGATA TAAACAAAAA GGGGATCACC CCCGACTATG TCGTTCCCAT GGACCCCCAG 
CTGGAGCAGC AGGTCCTGGC CCACGCCCCG GATCTGGAGC GGGACGTCCA GTTGCAGAAG 
GCCCTGGAGG TGCTGGGGAA ATAG

Protein sequence

MPRIWRQIGR GLLALCVLVT LAVGVGVATH FREVEQGVKT YALLRFQALQ PISTDKLMEG 
AIRGMVEALD DPYSTYLDAE TYRKLQESVT GSYGGVGLLI TLDEKDKRVV VVSPFKGTPA 
QRAGIKSGDY ITAIDGRDTT GMDLETASNL MQGEPGTRVE LTILSAGDSN PRKVALTREI 
IKVPTVDGRM LPGHPGVGYI SVTMFNEQTG ADLGRELNDL RQQGMQKLIL DLRNNPGGAL 
PAAVDVASYF VPQGPVVYIA DQKTSEPLMA RGYAQPLPLV VLVNKGSASA AEIVAGAIKD 
TKSGTLVGET TFGKGIVQTI FPLPGDAAVK ITTQKYLTPG KHDINKKGIT PDYVVPMDPQ 
LEQQVLAHAP DLERDVQLQK ALEVLGK