Gene Moth_1326 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1326
Symbol
ID	3831036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1370971
End bp	1372263
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	59%
IMG OID	637829262
Product	stage II sporulation protein P
Protein accession	YP_430182
Protein GI	83590173
COG category
COG ID
TIGRFAM ID	[TIGR02867] stage II sporulation protein P

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0674472
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTAAAG CCAGCCGGTC TTGGCGAATC CGGGGTAGCC TGGGCCTGCT GGTCCTGGCC 
CTGGTACTGG TAGGAGTCGT GTATACCCGG AGCCAGCAGC AGGGGACGGC TGTCCGTGTC 
TTCAGCCTGG CCGAGTTATT GCCGGGGAAC CACACCACCG GGCAATATTC AATCTTGGTT 
GATGAACAGG GCCGGGTCCT GGATATGATG GCCCGCCGGA TATATATCCA CGATGAATTT 
ATCTCAGCCG ATAACCGTCG TTACCGGGTA ATTCGCATTG AAGGTAATAA AGGCATCTGC 
CGGGAAATAG GGGTGGAGCA GATTTCCCAG GAGGATACCG GGGTTCCCGC CCAGGCAGGC 
CAAACCATGC CCGGCGATGG AACTAATCCG GTCCAGGCTG CCGGTAGCCA GATAATTGGC 
GTATATCACT CCCATGATGA TGAATCCTAC GTTCCCTCCG ACGGTAGCCA GAGTATCCCC 
GGGAACGGTG GCGTTTTAAG GGTAGGGAGC GCTTTTGCTG ATCGTTTACG CAGCCTGGGC 
TTGACGGTCG TTCACGACAC GACCTCCCAT GCCCCCCATG ATGACGGCGC CTACCGGCGC 
TCCCGCCGGA CGGCCATGTC CTTAATGCAG AGGGGAGCGG CAGCCTTATT TGATATCCAC 
CGGGACGGTG TACCGGATCC AACCTTTTAC CGCCGGACCA TCAACGGCCA GGATGTAACT 
ATGGTCCGCC TGGTGGTGGG ACGGGAAAAC CAAAACATGA GCGCCAACCT GGACTATGCC 
AAAAGACTAA AGGCAGCAGC CGATGCCCGT TATCCCGGCT TAATCTGGGG GATATTCATC 
GGCGCTGGCA GCTATAACCA GGACCTCTCG CCAAGGGCGA TATTGCTGGA AGCAGGTAGT 
CATACCAATA CGCTGCAGGA AGCAGAACGG GGCGTCACCC TTTTTGCCGA CGTCGTGCCG 
CCGGTCCTGG GGTTTGCCGC CCGGCCCGCT GCTGCCCGTA CGCCCAGTAC GGCCGCCGAC 
TGGAGGGGAG TCCTCTACGT CCTCCTGGCC TTTGTAATCG GTGGCGGTGC CTTTCTCCTG 
ATTTCCGCCG GTAGCTGGGA GAAGGCCGTT GCCCGGGTGA AGCAGTTTAC CTCTATAGAA 
TGGGTTAACC TGCTGGGCTG GCGGCAGCTG CGCAAACCCG GAGTTGACCG GAACAAAATA 
ACAGGCCGGG AAAGGGAGGC GGTCGAACTG GCGCCAGTCC CCCCTCGGGA ATTGGAAGCC 
AATGACGAGC GGGCCGACTG GCAAAAGGAC TGA

Protein sequence

MGKASRSWRI RGSLGLLVLA LVLVGVVYTR SQQQGTAVRV FSLAELLPGN HTTGQYSILV 
DEQGRVLDMM ARRIYIHDEF ISADNRRYRV IRIEGNKGIC REIGVEQISQ EDTGVPAQAG 
QTMPGDGTNP VQAAGSQIIG VYHSHDDESY VPSDGSQSIP GNGGVLRVGS AFADRLRSLG 
LTVVHDTTSH APHDDGAYRR SRRTAMSLMQ RGAAALFDIH RDGVPDPTFY RRTINGQDVT 
MVRLVVGREN QNMSANLDYA KRLKAAADAR YPGLIWGIFI GAGSYNQDLS PRAILLEAGS 
HTNTLQEAER GVTLFADVVP PVLGFAARPA AARTPSTAAD WRGVLYVLLA FVIGGGAFLL 
ISAGSWEKAV ARVKQFTSIE WVNLLGWRQL RKPGVDRNKI TGREREAVEL APVPPRELEA 
NDERADWQKD