Gene Moth_1812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1812
Symbol
ID	3830730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1871292
End bp	1872515
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	56%
IMG OID	637829739
Product	glycosyl transferase, group 1
Protein accession	YP_430655
Protein GI	83590646
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0100815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCGTC AGTTAAGCCT TAAAGATTAT GAAGGCGTAG CTGGAAGCGC CCTGATTGAC 
GAAATCCGAT CCCTGGGAGA AAGTTTACAA GGCTACAACG TCCGGCATAT CAACTCCACT 
ATTATCGGCG GCGGGGTGGC AGAAATCTTA AGCTCCCTGG TCCCCCTGAT GGAAGACGTG 
GGACTGACCG TCAACTGGGA GGTCCTAGCC GGCACCACGG AATTTTTCCA TACCACCAAG 
CTATTTCACA ACGGTATGCA TGGCCAGCCG GTAAATATCA CCGGCGAGAT GCTGGAGAAT 
TATCTGGCCA TAGCCCAAAA AAATCAGAAC CTCCTGGATG GAGATGCCGA CCTGGTGGTA 
ATCCATGACC AGCAACCCCT GGGGCTAACC GCCTTCCGCG GCAGGACCAG GGGCCGGTGG 
CTCTGGTACT GTCACGTCGA CCCGCGTTAT GCCGTACCAG AAGTATGGTA TTTTCTGGCG 
CCAATGGTGG CCACCTGCGA TGCAGCCGTA TTTCACCTGC CAGAATACGC CCGCGACCTG 
CCCGTCCTCC AGTACTTCAT GCCACCGGCT ATCGACCCCC TGTCTGACAA AAACAAGGAG 
GTGTCTCCCG CTGATTACGA AGCGGTGCTC GAAAAGCTGG GCGTAGATCC GGAAGGTCCG 
CCGGTAATCC TCCAGGTGTC CCGTTTCGAC CGGCTTAAAG ATCCTGCCGG TGTAATCGAG 
GCCTTTAAAC TGGTCAGGAA AAATATAGCC TGCCGCCTAA TCCTGGCCGG CGGGAGCGCC 
GATGACGACC CGGAAGGGGC TACTATCCTG GAAGAGGTGC GGGCATTGGC CGAGGGCGAC 
CCGGACATTA CCGTACTTTC GTTAAATCCC GACGCAAACC TGGAAATAAA CGTTTTGCAG 
CGGCGTGCCG ATGTGATAGT GCAAAAGTCA CTACGCGAGG GTTTTGGTTT AACGGCCACC 
GAGGCCCTGT GGAAGGGTAA ACCCCTGGTA GCTACCCCCA CCGGTGGCCT GGCCTACCAG 
GTGCTCGATG AGGAAACCGG ACTGACTGCC CGCACGGTGG AAGAGGTGGC CTTACAGGTA 
GAACGCCTGC TGGTCAACCC CACCCTCGGG AGACGTCTGG GCGCTGCCGG CCGGGAACAT 
GTCCGGCAGC GTTTTATCCT GCCGGTATAT TTGTATAACT GGTTAAAACT AATAAACTTG 
CTCAACGGAC GACGCTGCGG CTAA

Protein sequence

MIRQLSLKDY EGVAGSALID EIRSLGESLQ GYNVRHINST IIGGGVAEIL SSLVPLMEDV 
GLTVNWEVLA GTTEFFHTTK LFHNGMHGQP VNITGEMLEN YLAIAQKNQN LLDGDADLVV 
IHDQQPLGLT AFRGRTRGRW LWYCHVDPRY AVPEVWYFLA PMVATCDAAV FHLPEYARDL 
PVLQYFMPPA IDPLSDKNKE VSPADYEAVL EKLGVDPEGP PVILQVSRFD RLKDPAGVIE 
AFKLVRKNIA CRLILAGGSA DDDPEGATIL EEVRALAEGD PDITVLSLNP DANLEINVLQ 
RRADVIVQKS LREGFGLTAT EALWKGKPLV ATPTGGLAYQ VLDEETGLTA RTVEEVALQV 
ERLLVNPTLG RRLGAAGREH VRQRFILPVY LYNWLKLINL LNGRRCG