Gene Moth_2359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2359
Symbol
ID	3832539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2480208
End bp	2481167
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	49%
IMG OID	637830279
Product	glycosyl transferase family protein
Protein accession	YP_431185
Protein GI	83591176
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00260932
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAGTA AAGTGCGTTA TACCATTATC ATTCCGGTCT ATAACGAAGA AGACGTTATT 
CGTGAAACCT ATCGCCGGCT AACCCTGGTC ATGCAATCCC TCGGTGAACC GTATGAATTG 
CTGTTCGTCA ACGACGGTAG CGAGGATCGG ACGGCGGAAA TAATCGAAGT TTTAGCGGAA 
ACGGACGATA GCGTGAGGCT ACTGAATTTC TCGCGCAATT TCGGGCATCA AATAGCGATT 
ACCGCGGGCA TGGATTATGC CCGCGGGGAC GCCATCGTAA TTATCGACGC TGATTTGCAG 
GACCCGCCCG AGCTAATCCC GCGAATGATT GAGAAATGGC AAGAAGGATA CGAAGTCGTC 
TATGCACGGC GCGTTCAGCG GAAGGGGGAG ACGTTGTTTA AAAAATGGAC CGCTTCTTTG 
TTCTATCGTA CCCTTCGCAT GATGACAGAA GTCGATATTC CCCTGGATAC CGGTGACTTC 
CGTCTGATAG ACCGGAAAGT GTGTGATGTC ATGCATAGCA TCCGGGAGAA AAGCCGCTTT 
ATTCGCGGCC TGATCAGTTG GATAGGCTTT CGCCAGGCAG CCATTGAGTA CATCCGGGAG 
GAACGCTTTG CCGGAAAAAC AAAATACCCG CTGAAAAAAA TGCTGCGCTT AGCAATAGAC 
GGGATCACCT CTTTCTCCCA TAAACCTTTG AAATTGGCCA CATACCTCGG TTTGGCCCTC 
TCTTTGCCAA GTTTTGCCTA TCTGGTTTTC TCTCTGGGGT TAAAAATATT CACCGCCAGC 
ACAATCTCCG GGGGAAGATG GCTTTTTACC CTCCTGCTGT TGCTAAACGG TGTGAACTTC 
ATCCTATTAG GGATCCTGGG AGAGTATATC GGCAGAATTT ACGATGAAAC GAAAGACCGG 
CCGCTATATA TTCTACGCAA CAAGCAGGAA GCAGAAAATT TATTAGTTCG AAGGGGGTAA

Protein sequence

MKSKVRYTII IPVYNEEDVI RETYRRLTLV MQSLGEPYEL LFVNDGSEDR TAEIIEVLAE 
TDDSVRLLNF SRNFGHQIAI TAGMDYARGD AIVIIDADLQ DPPELIPRMI EKWQEGYEVV 
YARRVQRKGE TLFKKWTASL FYRTLRMMTE VDIPLDTGDF RLIDRKVCDV MHSIREKSRF 
IRGLISWIGF RQAAIEYIRE ERFAGKTKYP LKKMLRLAID GITSFSHKPL KLATYLGLAL 
SLPSFAYLVF SLGLKIFTAS TISGGRWLFT LLLLLNGVNF ILLGILGEYI GRIYDETKDR 
PLYILRNKQE AENLLVRRG