Gene Moth_1461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1461
Symbol
ID	3831347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1510215
End bp	1511891
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	58%
IMG OID	637829394
Product	GerA spore germination protein
Protein accession	YP_430314
Protein GI	83590305
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTCCGCT TGTGGCGCTG GCTGGGACGT AAAAAAACAT CCGGCGGGCA ACTTCCGGGG 
GACGACTCCC GCGCGGTAAA TCACCGTCTG GAGGTTAACA TTGCGTATAT CAAAAAAGCC 
TTCGGCCGGA GCGAAGACCT GGTGATCAGG GAGATAGAGC TTCCGGGCAG GAAACTGGCG 
CTGGTCTACG TGGAAACCCT CATCGACCGT GATGTGGTCC AGCGGGATAT CCTGCGTTCC 
CTCCTGGCGC TACAGACAAT ACCCCTGCCG GAGGACGAGG CAGGGTTCAA CCGGCTGCTC 
CGCGCCCGGT TGACCATCGG CGATCTCCAG GAAGAGCAAC TCTGGTCAAA AATAATCACC 
GGCCTGCTGG ACGGCAAGGC GGTTTTAATT GGAGAAGGCT TCAGCCGCTG CCTGCTGTTA 
AGTGTCGAGG GCTGGGAAAA GAGGCCGGTC GAGGAACCTG TTAATGAAGT TTCCATCCGC 
GGCCCCCGCG AGGGATTTGC AGAAAATTTA CCCACCAACA TCTCCCTCAT CAGGCGACGG 
CTGCGCGCGC CCGAGCTCCG TTTTGAAACC ATGAACCTGG GCCGGCGCAC CCACACGAAA 
GTAGTCATCT GTTACCTGGA AGGCCTGGCT TTACCCGGCG TCCTCGAAGA ACTCCGCCGC 
CGGTTGGAGC GCATCGACAT TGACGGCGTC CTGGAGAGCG GCTATATAGA GGAACTTATT 
GAAGACGCTC CCTTTTCCCC CGTACCGCAG CTTAACCGCA CGGAAAGGCC GGACAAACTG 
GTTGCCGATT TATTGGAAGG CAGGATAGGT GTTCTGACCG ACGGAACGCC CTTCGCCCTG 
GTCCTGCCAG GCAGCCTGGT ATCCCAGTTG CATGCCCCCG ACGATTATTA TGAGCGCTGG 
CCTTTAAGCA TGGGGATCCG CCTTTTTCGC TTTTTCGGCC TGTTTATCGC CCTGCTGCTG 
CCGTCCGTCT ATGTGGCCTG GACTTCCTAC CACCAGGAAA TGATACCCAC GCCCCTGGCG 
ATATCCATCG CCGCCCAGCG TGAGCTGGTG CCCTACCCGG CCGTTGTTGA AGCTTTAATC 
ATGCAGGTGC TTTTTGAAAT TCTCATCGAA GCCGGCATCA GGCTCCCCCG GGCCATAGGT 
ACGGCCATCA GCATCGTCGG GGCCCTGGTT ATCGGCGAAG CGGCCGTCCG GGCGGGACTG 
ATGTCTGCGG CGATGGTTAT TGTAATTTCA GCTACGGCCA TCGCCTCCTT CACCATACCC 
ACTTTCGGTT TGAGCCAGGC TGTGAGGATG CTCCGCCTGC CAATGATCTT CCTGGCCGGT 
GTCTTAGGCC TGCTGGGTAT TTTTGCCGGC CTAATGGCGC TCTTAATCCA CCTGGTGAGC 
CTGAGAAATT TCGGCGAGCC CTATCTAAGC CCCCTGGCGC CCTTTATCTG GGAAGGGCAT 
AAAGACCTGG TAGAACGGGT GCCCTGGTGG GCCATGCACT GGCGGCCTGT ACTACCCGGC 
CGGCAAGATT TGCGACGCAT CAAACCGGGC CTGCGACCCT CTACCACGGC CCGGGAGAGA 
AAGCCCGGCG AAGAACTGGA GACGTACCTG GGCGAAGAAG CCGGGAAAAG TATTACTACC 
GTTACAACCC CGAAAAAAGG GCGAAAAAAA AGAAAAAAAG GGTGGATAAA GATTTAG

Protein sequence

MLRLWRWLGR KKTSGGQLPG DDSRAVNHRL EVNIAYIKKA FGRSEDLVIR EIELPGRKLA 
LVYVETLIDR DVVQRDILRS LLALQTIPLP EDEAGFNRLL RARLTIGDLQ EEQLWSKIIT 
GLLDGKAVLI GEGFSRCLLL SVEGWEKRPV EEPVNEVSIR GPREGFAENL PTNISLIRRR 
LRAPELRFET MNLGRRTHTK VVICYLEGLA LPGVLEELRR RLERIDIDGV LESGYIEELI 
EDAPFSPVPQ LNRTERPDKL VADLLEGRIG VLTDGTPFAL VLPGSLVSQL HAPDDYYERW 
PLSMGIRLFR FFGLFIALLL PSVYVAWTSY HQEMIPTPLA ISIAAQRELV PYPAVVEALI 
MQVLFEILIE AGIRLPRAIG TAISIVGALV IGEAAVRAGL MSAAMVIVIS ATAIASFTIP 
TFGLSQAVRM LRLPMIFLAG VLGLLGIFAG LMALLIHLVS LRNFGEPYLS PLAPFIWEGH 
KDLVERVPWW AMHWRPVLPG RQDLRRIKPG LRPSTTARER KPGEELETYL GEEAGKSITT 
VTTPKKGRKK RKKGWIKI