Gene Mvan_4863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4863
Symbol
ID	4643841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	5205763
End bp	5207148
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	69%
IMG OID	639808334
Product	glycosyl transferase family protein
Protein accession	YP_955642
Protein GI	120405813
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.907872
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.125234
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGATCCT CCGGCGGCGC GCTGCCCCAG GCGGACGGCG TCCAGTCCGC GACCGGAGCG 
CCTGCGCAGG CCTCGCCTGC GCCGCCACCA CGGCCGGACG ACGCCGCAGG ATGGCCGCAG 
TGGTTGCTCT ACATCGTGAT GACGGTGATC TCGCTGCTGC TGTTCATCGT CGCCGCGACC 
ACGCTGTGGT GGATGCTGCA TGCGTGGCGA AGTCCGGAGT CGTTGCATTC CACCGGTTTT 
CGTCGCCGTT CTGCCGGCAG GCCGAAGGGC TTCTCGCTGT TGCTGCCGGC CCGGCACGAG 
CAGGACGTGC TCGGTGACAC CATCGACGCG CTGGCCCGGC TGGATCATCC GCTCTACGAG 
GTGATCGTGA TCATCGGCCA CGACGACCCC GAGACGGAAC ACGTGGCACG CGCCGCCGCT 
GCCCGTCACC CGCGGATCGT GCGCGTGGTC ATCGACACCA ACATCCCGAA GAACAAGCCC 
AAGGCCCTCA ACACCGCGCT TCCTACCTGC CGGGGTGAGA TCGTCGGGGT CTTCGACGCC 
GAGGACGAGG TCCACCCGAG GTTGTTGCGA CTGGTGGAGG CCCGGTTCGA GGAAGCACGG 
GCGGACGTCG TGCAGTCGGG CGTGCAATTG ATGAACATCC AGACCAGCTG GTGGTCGCTG 
CGCAACTGCC TGGAGTACTA CTTCTGGTTC CGGTCCCGTC TGCACTTCCA CGCCGACCAG 
CGGTTCATCC CGCTCGGCGG AAACACCGTG TTCGCCCGCA CCGCGCTGCT GCGGTCGGTC 
GGTGGCTGGG ACCGTGACTG CCTGGCCGAA GACTGCGAGA TCGGGGTGCG GCTGTCGACC 
CGGGGCGCGC GGGTGGCGGT CGCCTACGAC CCCAAGGTCG TCACGCGTGA GGAGACACCC 
GGCTCGCTCC GGGCGCTGGT CAAGCAGCGC ACCCGCTGGG ACCAGGGCTT CATGCAGGTC 
TACCGGAAGG GTGAGTGGCG CAAACTGCCC AGTAGACGGC AGCGGATGCT GGCGCGCTAC 
ACCCTCGCGA TGCCGTTCCT GCAGGCCGCC ACCGGCGCGC TGGTACCCAT CGCTATCGCG 
TGCATGTTCG TGCTCAAAGT GCCTGTCCCG CTGACGCTTC TGTCTTTCCT GCCGCTGGCC 
CCGACGCTGG TCACGGTGGC GGTGGAGGCG GCGGCCCTCG GCGAGTTCGG CAAGGAGTTC 
GGCATCAGGA TCCGGCTGTG GGACCAGGTC CGCTTGGTGC TCGGCGCATT TCCCTACCAG 
CTGCTGCTGG CCGCCGCGGC GGTGCGCTCG GTGTGGCGGG AACTGCGCGG TCAGGGCGGA 
TGGGAGAAGA CCGAACACGT CAACGCCCAC CGCGCCGGTG GTCGGGAGGA GGCGATCGCG 
GCATGA

Protein sequence

MGSSGGALPQ ADGVQSATGA PAQASPAPPP RPDDAAGWPQ WLLYIVMTVI SLLLFIVAAT 
TLWWMLHAWR SPESLHSTGF RRRSAGRPKG FSLLLPARHE QDVLGDTIDA LARLDHPLYE 
VIVIIGHDDP ETEHVARAAA ARHPRIVRVV IDTNIPKNKP KALNTALPTC RGEIVGVFDA 
EDEVHPRLLR LVEARFEEAR ADVVQSGVQL MNIQTSWWSL RNCLEYYFWF RSRLHFHADQ 
RFIPLGGNTV FARTALLRSV GGWDRDCLAE DCEIGVRLST RGARVAVAYD PKVVTREETP 
GSLRALVKQR TRWDQGFMQV YRKGEWRKLP SRRQRMLARY TLAMPFLQAA TGALVPIAIA 
CMFVLKVPVP LTLLSFLPLA PTLVTVAVEA AALGEFGKEF GIRIRLWDQV RLVLGAFPYQ 
LLLAAAAVRS VWRELRGQGG WEKTEHVNAH RAGGREEAIA A