Gene Moth_1506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1506
Symbol
ID	3831733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1550436
End bp	1551758
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	57%
IMG OID	637829438
Product	SpoIVB peptidase
Protein accession	YP_430358
Protein GI	83590349
COG category
COG ID
TIGRFAM ID	[TIGR02860] stage IV sporulation protein B

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCTTGA AACGCTTGGG GCACCGGGTC CTGGGCCTGG TGCTGGCGGC AATGTTACTC 
TACGGTGGCC TGGCTCCGCC GGTACGCAAT TTTTTTGCCC TCCCCTGGCA GCAGCGCCTG 
CCGGCAGCAG CGCCAATTTC CCTGCCCTGG GAACTGCCGC CGGGTCTGGC CCGCCAGGTC 
GAAGTGAAGG TTAATAGCGG GGACTGGAGC AGAGCCACTA CCGGCGATTT CCCCCGGTGG 
TTACAGCTAC AATTAAAATT GTTCGGCTTT ATTCCATTAA AGAATATTAC CATTCAGCTG 
GTACAACCGG TCGATGTTTC TCCCGGCGGC CAGGCTATAG GGGTCTTCTT GAAGACCGAA 
GGCGTCCAGG TAGTAGGCCA GGCGGCGATT GTAGACGAGA GGGGTAACAA GGTTTACCTG 
GCCCGGCAGG CAGGCCTGGA AACAGGCGAC GCCATCATCG CCATTGACGG TCAGAAGGTA 
ACCAGCGACC AGGAAGTGGC CAACCTGATC AATGCCGCCG GGCAGGCCAA TCGCCAGGCC 
AGGATCACCG TTAAAAGGGA AGGCCACTTG TTGACCCTGA ACATCCACCC TCGCTACTGC 
CAGGAAACAG GGCGCTACCG GATTGGCGTC TATGTCCGGG ACAGTACGGC CGGCGTCGGC 
ACCCTGACCT TTTACGATCA AAACAAGGGC GTTTTCGGTG CCCTGGGCCA CGTAGTTACC 
GGCAGTGACG GCCAGACGGC CATGGATATC AGCGGCGGCA GGATAGTAGC GGCGGCCATC 
CAGGGTATCC ACCAGGGCTA CCGGGGGCAA CCGGGAGAAA AGCTGGGCGT TTTTCTGGAA 
AACGGCCAAT TTAGCGGTAC TATACAGAAG AATACTATTG TTGGCATATT TGGAACGATA 
ACCGGCAAGC TTCCCGGTAA TAAAGAGATA CCAGTAGCCC TGGCCGATAC TGTCCACCCC 
GGACCGGCAG AAATCCTGAC GGTTATCGAA GGAGAAAAGG TCGAAAGTTT CCAGGTGGAA 
ATCGAACGGG TCATGCCCCA CCAGCGGGCC AGCGGCAAGG GCCTGGTCCT TAGGATTACC 
GACCCCAGGT TACTGGCCGT AACCGGAGGC ATTATCCAGG GTATGAGCGG GAGTCCCATT 
ATTCAAGACG GCCAACTGGC CGGTGCCGTA ACCCACGTCT TTATCAACGA CCCGACCCGG 
GGTTACGGGG TGCTGGCGGA ATGGATGCTC CAGGAGACAG AACTTGTTCC TAAAGATAAA 
GCCAGGGGTG CTACTGTCGA AACCCCTGGT TCTTTCCTTT TTGTGGTATT TTGTGTAGGA 
TAA

Protein sequence

MPLKRLGHRV LGLVLAAMLL YGGLAPPVRN FFALPWQQRL PAAAPISLPW ELPPGLARQV 
EVKVNSGDWS RATTGDFPRW LQLQLKLFGF IPLKNITIQL VQPVDVSPGG QAIGVFLKTE 
GVQVVGQAAI VDERGNKVYL ARQAGLETGD AIIAIDGQKV TSDQEVANLI NAAGQANRQA 
RITVKREGHL LTLNIHPRYC QETGRYRIGV YVRDSTAGVG TLTFYDQNKG VFGALGHVVT 
GSDGQTAMDI SGGRIVAAAI QGIHQGYRGQ PGEKLGVFLE NGQFSGTIQK NTIVGIFGTI 
TGKLPGNKEI PVALADTVHP GPAEILTVIE GEKVESFQVE IERVMPHQRA SGKGLVLRIT 
DPRLLAVTGG IIQGMSGSPI IQDGQLAGAV THVFINDPTR GYGVLAEWML QETELVPKDK 
ARGATVETPG SFLFVVFCVG