Gene Moth_1460 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1460
Symbol
ID	3831346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1508967
End bp	1510058
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	52%
IMG OID	637829393
Product	spore germination protein
Protein accession	YP_430313
Protein GI	83590304
COG category
COG ID
TIGRFAM ID	[TIGR00912] spore germination protein (amino acid permease)

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGAAA AAGGTAGGAT TTCTCTCTGG CAGTTTTTTG TGCTGGTTAC CGGGTACCTT 
ATTGGTACCT CTACCTTGAT CGTCCCTGTC GGGCCGGCCA AACAGGACGC CTGGATATCT 
TACCTGCTGG CGGGAACCCT GGGACTGGGC GCGGCCTATT GCTATACAGC CTTAGCCCGG 
CGCTTCCCGC GGGAAACCCC GGTGCAGTAT GCCACCAGGG TCCTGGGGCG CTGGCCGGGG 
ACCTTTTGCA ATCTTATTTT TCTCTGGTAC GCCCTGTACT TGGCCGCCCT GGTGCTGCGT 
AACGTTATTG AATTATATAA GATGGCGATC TTGCCCCAGA CGCCAATGGT TTTAGTCGCC 
GGAATTTTTG CCGGCCTGGC TGCCTACGCC ATTCGCATAG GGATAGAAAT CCCGGCGCGA 
TTAAGCGAGC TCTTAATTCC TTTTGTTATT GTCGCCATTT TGGTTCTTAC CGCCCTGGCG 
GAAGCTGTCC CGGGATTAGC CCACTGGGAA GCCCTCCTCC CGGTGATGGA AAGGGGGCCC 
CTGCCGGTCT TACGAGGGGT CTACCCGGCC TTTGTTTTTC CCTTCGGCGA AGCCGTCTTT 
TTTTTGGTCA TTTTACCTTT TTTAACCGAA CCCAGGAGAA ACTTTCCCCC CTTCGCCCTG 
GCGGTAACCG TGGCAACATT GCTCACCACC CTGGTCCTGG TGCGTAACCT CATCGTCCTG 
GGTCCTTCCG AAACGGCGCG GATAAATTTC CCCAGCCTGA TAGCCATTCA AATGATAAAT 
ATCGGTGACT TTTTGCAGCG GCTGGAACCG GTCATTATTT TCGTCTGGAG TTTTACTATA 
TTGCTGAAAC TGACTGTCGT CTACTATGTT TTTACCCTCG GCACAGCCCA GGTTTTCGGC 
CTCCGGGATT ACCGTCCCCT GGTGCTGCCA GCCGGACTGT TAATAACCTT TTTAGCTATG 
AGCCTCTATG AGAATTTTTC CCAGATGTTA ATTTTTGCCG GACGGGCCTT CCCCTTTTAT 
TTTCTCCCTG CCTACCTGTT CTACCCCGCT TTATTGCTCC TGGTGGCTAA AATAAGAAAA 
ATTAAAGGGT AA

Protein sequence

MIEKGRISLW QFFVLVTGYL IGTSTLIVPV GPAKQDAWIS YLLAGTLGLG AAYCYTALAR 
RFPRETPVQY ATRVLGRWPG TFCNLIFLWY ALYLAALVLR NVIELYKMAI LPQTPMVLVA 
GIFAGLAAYA IRIGIEIPAR LSELLIPFVI VAILVLTALA EAVPGLAHWE ALLPVMERGP 
LPVLRGVYPA FVFPFGEAVF FLVILPFLTE PRRNFPPFAL AVTVATLLTT LVLVRNLIVL 
GPSETARINF PSLIAIQMIN IGDFLQRLEP VIIFVWSFTI LLKLTVVYYV FTLGTAQVFG 
LRDYRPLVLP AGLLITFLAM SLYENFSQML IFAGRAFPFY FLPAYLFYPA LLLLVAKIRK 
IKG