Gene Mnod_5358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_5358
Symbol
ID	7301947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	5436707
End bp	5438008
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	72%
IMG OID	643602990
Product	glycosyl transferase family 28
Protein accession	YP_002500506
Protein GI	220925204
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID	[TIGR01426] glycosyltransferase, MGT family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.217134
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTGC TGCTGGCAGC CACCCCCCTG ACCGGGCACG TCAATCCGCT GCTCGCCGTG 
GCGCAGGCCG CTTCGGAGCG CGGGGACGAG GTCGTGGTGA CGACCTCGGA GGATTTCCGC 
CGAAAGGTCG AGGAAGCGGG CTTCCGCTGC CGTCCCTACG CGGACGATCA CGGGCCCGAA 
TACCGTGAGA CCGCCCTGCC GCCCGGTCCG GAGCGTGGCC GCCGGGAGTT CGAGCGCCGG 
TTCATCGACG GCATGCCCCG GCAGGCCGAG CTGCTGCGCA GCCTGATCGC CGAGGAGCGC 
CCGGACGTGG TGGTGGCGGG CAGCATGTTC CTCGGCGTGC TGCCGCTCCT CCTCGACAGC 
CGCAAGCGGC CGCCGATCGT CACCGTGAAC GTGAGCTTCC TGTTCCTCGA CCGGCCGGAT 
GGCGCACCCC TCGGCCCGGG GCTCCCGCCT GCCCGGGACG CGATCGAGCG GGCGCGCTAC 
GCGGCCATCA AGGCCGAGGT CGATGCCGCC TTCACGGATC AGGTCCGGGC CTACACGGAT 
GCGGTGCTGG CCCGTTCGGG TCTGCCCGGG CTGCCGGCCT CCCTGACGCA GGCGATCCTC 
ACCCTGCCGG ACGCCGTGGT GCAGCTCGGC GTCCCGGCTT TCGAATACGA TTTCGCGCCG 
CTGCCGCCGC AGATCCGTTT CGTTGGTGCC TTGCCGCCGC CCGCTGTTTC CGGTCCGCGG 
CCCGGCTGGT GGGCCGACCT CGACCGCGCC CGCCGCATCG TGCTCGTCAC CCAGGGCACC 
CTCGCGAATG CCGATTTCGG CGAACTCGTG GAGCCGACCT TCCAGGCGCT CGCCGATCGG 
GACGACGTGC TGGTCGTGGC GACGACCGGC GGCCGGCCTC TCGATGCGAT CCGCTTTCCC 
GTGCCGGCGA ATGGCCGGGT CGCGACCTTC CTGCCCTTCG GCGATCTGAT GCCCCGGCTC 
GACGCGCTGG TGACCAACGG GGGCTACGGC ACGGTGATCG CGGCGCTCCA GGCCGGGGTG 
CCGGTGGTGT CGGCCGGGCT CACCGAGGAC AAGGCCGAGG TCGGCACGCG CGTCGGATGG 
TCGGGCGTCG GGATCAACCT CGCCGCGAAC CGGCCGGACC CGCAGACCCT GCGCCGCAGC 
ATCGATGCCG TGCTGGACGA GCCCGGCTAC CGCGCCCGGG CGCAGGCGAT GGCGGAGGAA 
TTCGCCCGGC ACGACACGCC GCGCGAGATT CTCTCCGTCA TCGACGCCGT CCGCCAGATG 
CACCCGGCCG GGCGCCGTGA TCCCAATGGC CCAAGCTGCT GA

Protein sequence

MKLLLAATPL TGHVNPLLAV AQAASERGDE VVVTTSEDFR RKVEEAGFRC RPYADDHGPE 
YRETALPPGP ERGRREFERR FIDGMPRQAE LLRSLIAEER PDVVVAGSMF LGVLPLLLDS 
RKRPPIVTVN VSFLFLDRPD GAPLGPGLPP ARDAIERARY AAIKAEVDAA FTDQVRAYTD 
AVLARSGLPG LPASLTQAIL TLPDAVVQLG VPAFEYDFAP LPPQIRFVGA LPPPAVSGPR 
PGWWADLDRA RRIVLVTQGT LANADFGELV EPTFQALADR DDVLVVATTG GRPLDAIRFP 
VPANGRVATF LPFGDLMPRL DALVTNGGYG TVIAALQAGV PVVSAGLTED KAEVGTRVGW 
SGVGINLAAN RPDPQTLRRS IDAVLDEPGY RARAQAMAEE FARHDTPREI LSVIDAVRQM 
HPAGRRDPNG PSC