Gene Moth_1012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1012
Symbol
ID	3833315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1040373
End bp	1041452
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	48%
IMG OID	637828940
Product	spore germination protein
Protein accession	YP_429869
Protein GI	83589860
COG category
COG ID
TIGRFAM ID	[TIGR00912] spore germination protein (amino acid permease)

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000000935312
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGCGGGAAA GAATTGGAAC GAACGAAGCC ACCTTTTTAA TTGTTGCGGC AATGATTGAA 
GTGGGGACGT TAAAAGGGGC CAGGAATATT GTTGAAAAAG TCGGGGTGGA CACCTGGCTG 
GTATCTCCCC TGGAAACTAT ATTCAGCCTC GGAGCTATTT ACCTCCTGAC CGCGCTTGTT 
ATGAAATTTC CTGACCTGGA CCTAGTTGGT TTTAGCCGCC GCCTGGTAGG CAAGTGGCTG 
GCCTGGCTTT TAGGTTTAAT AGTTTTAGTT TACTGGGTTG GTTTAACGGC CGAGGTCGGC 
CGGGTAACTG CTGATACTAT TAAGAGTTCT TTGTTGTCGC ACACACCCGA TGCAGTAGTG 
TTATCTTCTT ACCTGCTGGT AGCGGCCTAC CTGGCTGGAA AGGGTTTAGA GCCCCTGGCA 
CGTGCTTCTA TCATCATTGT TATTTTTACT TTACCCATCA CCTTGCTTCT CTTTGCCCTG 
GTTATACCGC GAATCCATCT GGACAACTTC TTACCCATCT TGCCCCATGG ACCCTGGCCG 
GTGATAAAGC TGGCTTTATG GCGGATTAGT AACGCTGAAG AGATGAGTCT TTTCCTTATC 
CTGGTTCCTT TTTTAAAGGA ACCCCGGCGA GCCTGGCGTG CCGCCAGCTA TGGCTTTTTA 
ACAGTCATGG CAGTAGTGAT CACCATTATA ACTACCTGTC AGGGGGTTCT GGGGGTAGAT 
CAACTGAAGT ATACGCTGAT TCCAGGTTTA ACTGTGACGC AACTGGCAGA ATTCGCTGGA 
GCCTTTATCG AACGGATTAG CCTGATATTC ATTTCTGTAT GGATTATTTT AGTCTTTCCT 
ACCGCCTCGG CTCTCCTCTG GGCAAGCTCA TATTTGCTAG GCCGCCTCTT AAACTTAAAA 
GACTATAAAA TGTTGGCTTT TTACCAGTTA CCCGTAGTTT ATTACTTAGC CTGGCGGCCC 
GGTAATCCCT TTGAAGTTAA AAGCTTCTTT TTCTTTCTTC AACCCCTGGG CCTGGTGGTA 
TTGGTAGGCA TCCCCTCCTT ACTTTATCTT GTTGCCCTTT TTCGTTGTCG CGCTCGGTGA

Protein sequence

MRERIGTNEA TFLIVAAMIE VGTLKGARNI VEKVGVDTWL VSPLETIFSL GAIYLLTALV 
MKFPDLDLVG FSRRLVGKWL AWLLGLIVLV YWVGLTAEVG RVTADTIKSS LLSHTPDAVV 
LSSYLLVAAY LAGKGLEPLA RASIIIVIFT LPITLLLFAL VIPRIHLDNF LPILPHGPWP 
VIKLALWRIS NAEEMSLFLI LVPFLKEPRR AWRAASYGFL TVMAVVITII TTCQGVLGVD 
QLKYTLIPGL TVTQLAEFAG AFIERISLIF ISVWIILVFP TASALLWASS YLLGRLLNLK 
DYKMLAFYQL PVVYYLAWRP GNPFEVKSFF FFLQPLGLVV LVGIPSLLYL VALFRCRAR