Gene Moth_1685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1685
Symbol
ID	3833285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1723787
End bp	1724701
Gene Length	915 bp
Protein Length	304 aa
Translation table	11
GC content	49%
IMG OID	637829610
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_430530
Protein GI	83590521
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1732] Periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system (osmoprotectant binding protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00261059
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.299717
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGCCAGA AATCCAAACG AGTGGGGAAG CTGATCGCGC TATTTACAGG CATCGCTATG 
TTGCTATTTG TAGCTGCCGG CTGCAGTGGA ACCAGGGCTA AAGGCACAGT GGTTGTAGGG 
TCCAAGGACT TTACCGAAAA CATTCTCCTT GGCGAGATAA TGGCCCAGCT CATAGAAGCC 
CATACGGACC TGAAGGTGGA ACGCAAATTG AACTTGGGCG GTACATTGGT TAACTTTAAC 
GCCCTTAAAA AAGGCGACCT TGATCTCTAC GCTGACTACA CCGGTACCGG CCTAGTGGCA 
ATCTTAAAAA GGGATGTTAT CAATGACCCC CAGGAGGCTT ACGATGCAGT TCAAAAGGCA 
TACAACGAGC AGTTTAAGCT AAAGTGGCTG AAACCCTTTG GCTTTAATAA CACCTACGCC 
CTTGCGGTAC CGGAGGAGGT TGCTCGACAG CGTAACTTAC AAAAAATATC CGACCTGAAA 
AGCGTAGCCG GTGAGATGGT ACTCGGGGCC GAGCAGGAAT TTTTTAACCG CCCGGACGGC 
TATGACGGCT TAATTGTCAC TTACGGGCTA AATTTCAAAA GCACCAAGCA GATGGAAACC 
GGCTTAAAAT ACGAAGCCAT TCATAACAAG ATGGTAGATG TGATCGACGC CTTCGCCACC 
GACGGCCAGT TGATTACCTA TAAGCTAAAG ATCCTGGAAG ATGATAAACA ATTCTTCCCG 
CCCTACTTTG CTGCACCGTT GGTACGTATG GACACCCTCG AGAAGTATCC CCAGCTGGAA 
GAAGTCCTGA ACAAGCTGGC GGGCCAGCTC AATGATGATG AGATGCGTCA GCTGAATTAT 
CAGGTCGACG AGGAAAAAAA GGAAGTGGCC CAGGTGGCAA GAGATTTCCT GCTGAAAAAA 
GGCCTGATCA AGTAA

Protein sequence

MRQKSKRVGK LIALFTGIAM LLFVAAGCSG TRAKGTVVVG SKDFTENILL GEIMAQLIEA 
HTDLKVERKL NLGGTLVNFN ALKKGDLDLY ADYTGTGLVA ILKRDVINDP QEAYDAVQKA 
YNEQFKLKWL KPFGFNNTYA LAVPEEVARQ RNLQKISDLK SVAGEMVLGA EQEFFNRPDG 
YDGLIVTYGL NFKSTKQMET GLKYEAIHNK MVDVIDAFAT DGQLITYKLK ILEDDKQFFP 
PYFAAPLVRM DTLEKYPQLE EVLNKLAGQL NDDEMRQLNY QVDEEKKEVA QVARDFLLKK 
GLIK