Gene Mvan_1042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_1042
Symbol
ID	4645353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	1094953
End bp	1096089
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	69%
IMG OID	639804543
Product	glycosyl transferase, group 1
Protein accession	YP_951886
Protein GI	120402057
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGCGAC CGATCCCCCG GACGGTCCGA TTCGGCCTGC TCAGTACTTA CCCTCCAACA 
CCGTGCCGAC TCGCGAATTA CAGCTCAGCG CTGTTTGGCG CCTTGAGCGC GCGCGGGTCC 
CAGGTGAGCG TGGTGCGGGT TGCCGACGGC TCACAGTCGA GTGACGCCAG GATCGTCGGG 
GAGTTGGTCA ACGGCTCGGC GCGATCGGCG GCGCACTGCG TCGACTCGCT CAATCACAGC 
GACGTCGCGG TGATTCAGCA CGACTACGGC GTTTACGGTG GCGCACACGG CGACGGCCTG 
CTGGACGTCA TCGACGGGCT GCGCGTCCCG ACGGTGGCCG TCGCCCATAC GATCTTGAAA 
AACCCTGCGC CACATCAACG TTGGGTGATG GAGCGGATGG CGGCGACGAT CGACCGGATG 
GTGGTGATGT CCGAGGCGGC ACGGGAGCGG CTGTGCCGTG AGTACGGCGT GGACCGCCGC 
AAGGTCGTCA CGATCCCGTA CGGTGCGGTG CTGCCCACCG GCCCACGTGC GAAGCGTGGC 
AGCAGGCCCA CCATCCTGAC GTGCGGTCTG CTCGGCCCCG GTAAGGGCGT CGAGCGCGTC 
ATCGACGTGA TGTCCTCGTT GCAGAGCGTG CCCGGCCATC CCCGCTATGT GGTGGCGGGC 
CGCACGCATC CGAAGGTGCT GGCCCGCGAC GGCGAGGCCT ACCGCGAAGC CCGCATCGAG 
CAGGCCCGCC GCCTCGGTGT CGCGGATTCG GTGACCTTCG AGGACCGCCA CCTGGACCGG 
GCATCGCTGG CAGCGCTCTT CCAGGCGGCG GCAGTCATCG TCTTGCCCTA CGACTCCACC 
GATCAAGTGA CCTCGGGAGC CCTGGTCGAC GCAGTCGCCA GCGGCAGACC CGTCGTGGCC 
ACCGCGTTCC CGCATGCGGT GGAGGTCCTG CGGGACGGTG CCGGCATCCT CGTCCCCCAT 
GACGATCCCG AGGCCCTGTC CTGCGCGCTA CGCCGTGTCC TGACACAGCC GCGGCTGGCC 
GGGTCGCTGG CCGCCGAGGC GCGGCAACTG GCGCCGGCGA TGGCGTGGCC GGTCGTTGCC 
GACACCTACC TGGAGCTGGC GGCTCGCCTG CTGACGGAGC GGCAGCTACG CGTGTGA

Protein sequence

MKRPIPRTVR FGLLSTYPPT PCRLANYSSA LFGALSARGS QVSVVRVADG SQSSDARIVG 
ELVNGSARSA AHCVDSLNHS DVAVIQHDYG VYGGAHGDGL LDVIDGLRVP TVAVAHTILK 
NPAPHQRWVM ERMAATIDRM VVMSEAARER LCREYGVDRR KVVTIPYGAV LPTGPRAKRG 
SRPTILTCGL LGPGKGVERV IDVMSSLQSV PGHPRYVVAG RTHPKVLARD GEAYREARIE 
QARRLGVADS VTFEDRHLDR ASLAALFQAA AVIVLPYDST DQVTSGALVD AVASGRPVVA 
TAFPHAVEVL RDGAGILVPH DDPEALSCAL RRVLTQPRLA GSLAAEARQL APAMAWPVVA 
DTYLELAARL LTERQLRV