Gene Moth_0612 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0612
Symbol
ID	3832587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	637402
End bp	638382
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	45%
IMG OID	637828553
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_429485
Protein GI	83589476
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTATTTA AAATGACCCG AAAAAAGATG CTTATTTTTA CCGCAATAAC ACTAATTGGA 
GTCAGCGTGC TCCTTGGTGG TTGCGGCAGT AAACAAGGTA ATACCCAAAC TGGAACCTCC 
AGCGGAACAA CGACCCAGAA CACAGAAAAG AGCGGAGAGA AGGTCATTGG CGTTAGCCTT 
CTGACCCGGG AACACGTTTT TTACAACTTA ATTGAAAAAG CTATCCAGGA AAAAGCCCAG 
GGGTATAAAT TTAAACCCAT TATTATGGAT GCCAGCCAGG ATAGCAACAA GCAATTGGCC 
CAGGTTCAGG ATTTTATAAC TCAAAAAGTG GATGCCATTG TTTTGGCGCC AACGGCTTCG 
GCTGGAATAG CACCGGCTGT TGACTTAGCT AAAAAAGCAG GTATCCCTGT ATTTACAATT 
GATATCAAAG CTGAAGGTGA CGTAAAATCC CATGTCGCCA CCGACAACTA CGCGGGTGGT 
AAACTGGCTG CCAAGTATGC CGCCGAAAAG GTCTTGAACG GCAAGGGGAA GGTTGCTATA 
ATTACCTACT CCGAAGTACA GAGCTGTGTT GACCGGGAGA AGGGTTTCAA AGATGCCCTG 
GCTGAGTATC CGAACATTAA GGTAGTCGAT GTAGAAAATT GTTCTGGTAG CGCTGAAAAA 
GCAGCCAACC TCACCCAGGA TATCCTGTTA AAGTTCCCGG ATTTAGATTT AATTTTCGCC 
GTGGGTGATC CCTTTGCTGT TGGAGCTGTT TCCACTATTA AAGCAGCTGG CCGTAATGTT 
AAAGTTATAG GCTTCGACGG TAATCCTGAA GCTATCCAGG AAATCAAGAA CCATGGACTC 
TGGGTGGCTG ACGTTGTCCA GCATCCTGAT CAAATCGGTG GCAAGGTAAT TGATCTAATC 
GCTGATTACT TCAACGGTAA ATCTGTACCG CCACAGGTGC TCATTCCGCC TACAATAGTA 
GATGCCAGTA ATGCTAAATA A

Protein sequence

MLFKMTRKKM LIFTAITLIG VSVLLGGCGS KQGNTQTGTS SGTTTQNTEK SGEKVIGVSL 
LTREHVFYNL IEKAIQEKAQ GYKFKPIIMD ASQDSNKQLA QVQDFITQKV DAIVLAPTAS 
AGIAPAVDLA KKAGIPVFTI DIKAEGDVKS HVATDNYAGG KLAAKYAAEK VLNGKGKVAI 
ITYSEVQSCV DREKGFKDAL AEYPNIKVVD VENCSGSAEK AANLTQDILL KFPDLDLIFA 
VGDPFAVGAV STIKAAGRNV KVIGFDGNPE AIQEIKNHGL WVADVVQHPD QIGGKVIDLI 
ADYFNGKSVP PQVLIPPTIV DASNAK