Gene Moth_2154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2154
Symbol
ID	3833003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2257647
End bp	2259047
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	48%
IMG OID	637830076
Product	glycosyl transferase family protein
Protein accession	YP_430986
Protein GI	83590977
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.119958
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCACAA ATTCAGTGGT GCTTTACACT CATTTAACTC AAAATCCTTC TCCAGCACCG 
GTAAAAGGTA AAACTTTTGG TGTTCGCCCT GCTCCATCAA CCCGGAGGTA CATATCGGTC 
GCTCAAAAGT TCTGGATAAG TCAAACTGGT GCTCTTGTAT GGGTTAGCCT ATCTGTAATT 
TTGTCCCTGC CCTGGTTACG TGATTTGAGC GAAGTAATAG GTTTTGTGTC TGCGATTCTG 
GTAATCACTT TTATCGCTTA CGTCCCAGGT TACCTGGTTG CTTTTCTGGC CGTCAGTTTA 
CTGGTTGACC GTCAGCCTCC TTTCAAAGTG TCCGACCCTG ATTTACCAAT AACGATATTA 
ATCGCTGCTC GTAACGAAGC ATCGAACATT GGGATGACCC TCCAATATAT TGCTAATCAG 
AATTACAGGG GGCCAATTTC AGTAGTTTTG GTCGACAACG GTTCTACAGA CGGGACAGCC 
GATGTTGCGC TGGCAAAAGC ACGGGAACTC AAGTTAAACC TTTTGTGCCT CCGGGAAGAA 
AGCCCGGGCA AGAATTTTGC ATTGAATGCC GGGCTAGCCA AAATAGTAAC GCCGTATTTT 
ATAACTCTGG ACGCGGACAC CCTGCTTCAC CGTTTCGCGG TTAAACACAT AGTAGCCAGG 
TTGCTGAGTT CGCCCCCGGA TGTAGGGGCA GTGGCCGGCC ACGTTCTCGT TCGCAATAGC 
AGGGACAACT TTTTAACAAG GATCCAGGAA TGGGATTATT TTTTGGGTAT TGCTTCCATT 
AAGCGGACGC AGGGGCTATA CCAGGGAACG CTGGTTGCCC AAGGAGCCTT CAGTCTCTAC 
AAAACCGAGG CTGTGCGCCA AGTCAGTGGG TGGCCGGACA CTATTGGAGA AGATATTGTG 
CTCACTTGGA AGTTACAGCA AGCCGGTTAC AGAGTTTATT TCGAGCCCAC GGCAGTGGCC 
TTTACAGCCG TTCCTAAAGT CGTGCGGCAT TTTGTCCGGC AAAGGAGCCG TTGGGCAAGG 
GGGATGGTCG AAGGTATGAA GAATGTCCCC CCTTGGTACC AGCCGAGCTA CTTAAAAAAG 
TTTCTGACCG GAATAGACTT GGTAATTCCG GTTATTGACC TCTTTTACAC GCTGGTATGG 
ATTCCTGGCC TCATACTCGC ATGTTTTGGT AAATATTATA TCGTCGGACC TTATACCCTC 
TTCGTCTTGC CCCTCAATAT AGGCGTGAGC CTTATTATGT ATACCTACCA ACTAAGAGTG 
TTTGGCCAGC TCGACCTCCG CGTCAGGAAA AACAGGCTGG GCTTTTTTGC TTATGTTTTG 
ATCTATCAAT TGATTAGCTC TCCGGTTTCA CTTTGGGGCT ATGTGCAAGA ACTGTTTCAA 
ACTCGTCGGG TTTGGCGTTA A

Protein sequence

MTTNSVVLYT HLTQNPSPAP VKGKTFGVRP APSTRRYISV AQKFWISQTG ALVWVSLSVI 
LSLPWLRDLS EVIGFVSAIL VITFIAYVPG YLVAFLAVSL LVDRQPPFKV SDPDLPITIL 
IAARNEASNI GMTLQYIANQ NYRGPISVVL VDNGSTDGTA DVALAKAREL KLNLLCLREE 
SPGKNFALNA GLAKIVTPYF ITLDADTLLH RFAVKHIVAR LLSSPPDVGA VAGHVLVRNS 
RDNFLTRIQE WDYFLGIASI KRTQGLYQGT LVAQGAFSLY KTEAVRQVSG WPDTIGEDIV 
LTWKLQQAGY RVYFEPTAVA FTAVPKVVRH FVRQRSRWAR GMVEGMKNVP PWYQPSYLKK 
FLTGIDLVIP VIDLFYTLVW IPGLILACFG KYYIVGPYTL FVLPLNIGVS LIMYTYQLRV 
FGQLDLRVRK NRLGFFAYVL IYQLISSPVS LWGYVQELFQ TRRVWR