Gene Mvan_5202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5202
Symbol
ID	4645719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	5568176
End bp	5569378
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	67%
IMG OID	639808677
Product	virulence factor Mce family protein
Protein accession	YP_955979
Protein GI	120406150
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID	[TIGR00996] virulence factor Mce family protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.977841
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.17737
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACG GTAATGCGAA GCGCAGTCAT GTGAGGATCG CTGCGGCGAT CCTCGCTGCG 
CTGGTGCTCG CCGCAGCCGT GTTCACGTAT CTGTCCTACA CCGCGGCGTT CACCCCGACG 
GACAAGGTGA CGGTGCTCTC GCCGCGGGCC GGCCTCGTCA TGGACGTCGA CGCGAAGGTC 
AAGTACCGGG GGATCCAGGT CGGCAAGGTC GAATCGATCG AGTACGCCGG TGACGCCGCC 
AAGCTCACGC TGGCGATCAA CCGCGGCGAC CTGCGGTACA TCCCGGCCGA CGCCCCGGTG 
CGCATCGGTG GCACCACGAT CTTCGGCGCC AAGTCGGTCG AGTTCCTGCC ACCGGAGTAC 
CCGAACGGCC AGGCGTTGAG CCCCGGCGCC GAGGTGAAGG CCGACTCCGT TCAGCTCGAG 
GTCAACACGC TGTTCCAGAC CCTGACCGAC CTGCTGGACA AGATCGACCC GATCGAACTC 
AACGCCACCC TGTCCGCGCT GGGCGAGGGT TTGCGCGGCA ACGGCGACGA CGTCGGCGCG 
CTGCTGTCCG GACTGAACTA CTACGTCGGT CAGCTCAATC CGAAACTGCC CGCGCTGCAG 
GAGGACCTGC GCCGCACCGC GGTCGTCGCC GACATCTACG GCGACGCCGG ACCGGACCTG 
GTCCGCGTCC TCGACAACGC CCCCGCCATC AGCAAGACCA TCGTCGACGA ACAGGACAAC 
CTGAACGCGG CTCTGTTGGC GGCGACCGGG CTGGCCAACA ACGGGACGGC GACTTTCGAG 
CCCGCCGCCG ACGACTACAT CGCCGCGGTG CAACGCCTGC GCGCTCCGCT CAAGGTCGCC 
GGGGAATACT CGCCGGTGAT CGGTTGCACG CTGAAAGGCA CGGCGAACGC GATCGACCGG 
TTCGCGCCGA TCATCGGTGG GATCAGGCCC GGCCTGTTCG TCTCGTCGAA CTTCCTGCCC 
GGTTCGCCCG CGTACACCTA CCCGGAGAGC CTGCCGATCG TCAACGCCTC GGGCGGCCCG 
AATTGCCGTG GCCTGCCTGA TGTTCCGAGC AAGCAGTACG GCGGGTCCTG GTATCACACA 
CCGTTCCTGG TCACCGACAA CGCCTATGTT CCGTACCAGC CGAACACCGA GTTGCAGTTC 
GACGCGCCGT CGACGCTGCA GTTCCTGTTC AACGGCGCTT ACGCGGAAAG GGACGACTTC 
TGA

Protein sequence

MADGNAKRSH VRIAAAILAA LVLAAAVFTY LSYTAAFTPT DKVTVLSPRA GLVMDVDAKV 
KYRGIQVGKV ESIEYAGDAA KLTLAINRGD LRYIPADAPV RIGGTTIFGA KSVEFLPPEY 
PNGQALSPGA EVKADSVQLE VNTLFQTLTD LLDKIDPIEL NATLSALGEG LRGNGDDVGA 
LLSGLNYYVG QLNPKLPALQ EDLRRTAVVA DIYGDAGPDL VRVLDNAPAI SKTIVDEQDN 
LNAALLAATG LANNGTATFE PAADDYIAAV QRLRAPLKVA GEYSPVIGCT LKGTANAIDR 
FAPIIGGIRP GLFVSSNFLP GSPAYTYPES LPIVNASGGP NCRGLPDVPS KQYGGSWYHT 
PFLVTDNAYV PYQPNTELQF DAPSTLQFLF NGAYAERDDF