Gene Mvan_3033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3033
Symbol
ID	4647215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	3197711
End bp	3198817
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	72%
IMG OID	639806511
Product	glycosyl transferase, group 1
Protein accession	YP_953842
Protein GI	120404013
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.125228
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGTGG TCCAGGTGGC GAACTTCTAC GGCCCCCGCT CCGGCGGACT GCGCACCGCG 
GTCGACCGCC TCGGCGCCGA GTACTGCGCG GCCGGACACA CCGTGTTCCT CATCGTGCCG 
GGGCCGCACC CCGAAAGGGT GACGCTGCCG TCGGGCGTCG TCCGCATCTG CCTGCCCGCC 
AGGCTGATCC CGTACACCGG CGGATACCGC GCGGTGCACC CGGGTCCGGT CATCGCGCTA 
CTCGCCGAAC TGCGCCCCGA CGCGCTGGAA GTGTCGGACC GGCTGACCCT GCGGTCGCTG 
GGGCCGTGGG GGCGCAGGCA CGGTGTGTCG ACGGTGATGA TCTCCCACGA ACGACTGGAT 
CGGCTTGTCG GGCAGATACT TCCGGTGCCG ATCGCACGAG CGGTGGCCGA CGTCGCCAAC 
CGGCGGACCG CGGCCAACTA CGACGCGGTC GTGTGCACCA CGGCGTTCGC CCGCGAGGAG 
TTCGACCGGA TCGGGGCGAC GAATGTGGCA ACGGTGCCGC TGGGCGTCGA CCTCGAACAG 
TTCCACCCCC GCCGCCGCTC GGCGGAGGTC CGGCGCCGAT GGGCAGCGCC AGAGCAGTCC 
TTGCTGGTGC ACTGCGGACG GCTCTCGGTC GAGAAGCAGC CGCACCGTAG CATCGAAGCC 
GTTGCCGCGC TGCGCGATTC GGGTATCGAC GCCAGACTGG TGGTGGTCGG CGAAGGCCCG 
CTGCGGGCCC GGTTGCAGAG GCAGGCGGTG CGACTGCCCG TCGAGTTCAC CGGGTACATC 
GGCTGCCGGG ACACCGTCGC CGACATCCTG GCCAGTGCCG ACGTCGCGCT GGCGCCCGGC 
CCGCACGAGA CGTTCGGGCT GGCCGCGCTG GAAGCGCTGG CGTGCGGCAC CCCGGCGGTG 
GTGTCACGGA CCTCGGCGCT GGCCGAAATA CTGACCGACG ACAGCGGCGC CACCGCCGAC 
AACGATCCAC ACGCCATCGC CCACGCCGTC AGTACCGTCC TGACCCGCCC CGAGCACCAA 
CGCCGACACA GCGCACGGCA GCGTGCCGAG CAGTTCACCT GGCCGAGATC AGCGGCGGGA 
ATGCTCGGCG CGCTCGGCGC CCGGTGA

Protein sequence

MRVVQVANFY GPRSGGLRTA VDRLGAEYCA AGHTVFLIVP GPHPERVTLP SGVVRICLPA 
RLIPYTGGYR AVHPGPVIAL LAELRPDALE VSDRLTLRSL GPWGRRHGVS TVMISHERLD 
RLVGQILPVP IARAVADVAN RRTAANYDAV VCTTAFAREE FDRIGATNVA TVPLGVDLEQ 
FHPRRRSAEV RRRWAAPEQS LLVHCGRLSV EKQPHRSIEA VAALRDSGID ARLVVVGEGP 
LRARLQRQAV RLPVEFTGYI GCRDTVADIL ASADVALAPG PHETFGLAAL EALACGTPAV 
VSRTSALAEI LTDDSGATAD NDPHAIAHAV STVLTRPEHQ RRHSARQRAE QFTWPRSAAG 
MLGALGAR