Gene Mvan_0415 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0415
Symbol
ID	4645893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	452093
End bp	453667
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	72%
IMG OID	639803923
Product	PPE protein
Protein accession	YP_951269
Protein GI	120401440
COG category	[N] Cell motility
COG ID	[COG5651] PPE-repeat proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.284434
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCCC CCGTCTGGAT GGCGCTGCCG CCCGAGGTGC ACTCGGCGCT GCTCAGCAGC 
GGCCCCGGTC CGGGGTCGAT GCTGGCCGCA GCAGCGACAT GGCAGTCGCT GAGCGCCGAG 
TACGCCGCTG CCGCAGCAGA ACTCAGCTCG ATTCTGGCCG ACGTGCAGGC CGGGGCGTGG 
GAGGGCCCGA GCTCGGAACA GTACGTGGCC GCGCACACGC CCTACCTGGC GTGGCTCGCG 
CAGCAGAGCG CGGCCGGCGC CGCCGCGGCG GCGCAGCACG AGGCCGCCGC GGCCGCATAC 
TCGACGGCGC TGGCGACGAT GCCGACGCTG CCCGAACTGG CGCTCAACCA CACCACCCAC 
GCCGTGCTGG TGGCCACGAA CTTCCTCGGC ATCAACACGA TTCCGATCGC GATGACAGAG 
GCCGACTACG TCCGCATGTG GATCCAGGCG GCCACCACCA TGGCGACCTA CCAGGCGGTC 
TCGGGCGCTG CACTGGCCGC GACGCCGACC GCGACACCCG CCCCGTTCGT GCTGGCGCCC 
GGTGTGGGGG AAGCCGGCAG GGCAGCAGCT GACGTCACCG CCTTCGCCGC GCAGGCGCAG 
GCCGCGGAAG CCGGTTCAGC CCTGGATCTT TCCAACATCA TCGCCGACCT GATCCGCGCC 
TACGGTGAAC TGCTCAGGTT CCTGTTCGAA CCGATCTTCG ACTTCCTGCG TGACCCGCTC 
GGAAACACCA TCAAGCTCAT CACCGACTTC CTGACCAACC CGGCGCAGGC GCTGATCACT 
TGGGGCCCGT TCCTGGCCGC CGTTGCCTAC CAAGCAGTTT CGTGGGTGGG CGCCTCGATC 
CTGTACCCGT CACTTCTGCT CCTGCCGCTG GTGGCGACCA CGCTCGCGAT CGTGCTCGGG 
GTGGGTGCCT ACCTCTTGGA GAACCTGCCG GCGCCCGCCG AAGACGCACC TGCCGAGGAA 
CCCGCCGCAT CGTCGCCGGC GCCCACCCGC GCCGACCAGC CGAGTCCCGC AATCGCGGTC 
TCGGCGCCCC CACCACCGAG CAGCGCGGCG GCGACGGTGG GCACGGTGGC GACGGGGACG 
GCGCCGGCAC CGGGCGCTCC TGCCGCCGCC ACTGCGTCGT TCGTGCCTTA CGCGGTGGCC 
GGCCGCGACC CCGGAACGGG CTTCTCGCCG ACCGTGCGTG ATTCGACCAG CGCCAAGGCG 
CCGGCCTCCG GCATCCCGGC GGCGGCGTCG GGCGTCGCGG CCTCGGCGGC GGAGCGGCGT 
AAGCGCAGGC GCCGCCAGAA GGACGAGATC GCCGGTCGCG CCTACGCCGA CGCGTACGCC 
GACTACGAGC CAGAGCCCGA CGACGAACCA CCGGTGCGGC AGGAGCCGCG GATCGCCGCC 
ACCGAGCGCG GTGCCGGCCC CATGGGCTTC GCCGGCACGG TGTCCAGGGA CGCCGCACAG 
GCCGGCGGGT TGACCACGCT GCCGGGCGAC CCGTTCGGCG GCGGACCGAA AGCGCCGATG 
CTGCCGGGGA CCTGGGACCC GGACACCGAA CCCGACGAAC GCCACAACCA CCACGATGGA 
AAGGACTCTC AATGA

Protein sequence

MSSPVWMALP PEVHSALLSS GPGPGSMLAA AATWQSLSAE YAAAAAELSS ILADVQAGAW 
EGPSSEQYVA AHTPYLAWLA QQSAAGAAAA AQHEAAAAAY STALATMPTL PELALNHTTH 
AVLVATNFLG INTIPIAMTE ADYVRMWIQA ATTMATYQAV SGAALAATPT ATPAPFVLAP 
GVGEAGRAAA DVTAFAAQAQ AAEAGSALDL SNIIADLIRA YGELLRFLFE PIFDFLRDPL 
GNTIKLITDF LTNPAQALIT WGPFLAAVAY QAVSWVGASI LYPSLLLLPL VATTLAIVLG 
VGAYLLENLP APAEDAPAEE PAASSPAPTR ADQPSPAIAV SAPPPPSSAA ATVGTVATGT 
APAPGAPAAA TASFVPYAVA GRDPGTGFSP TVRDSTSAKA PASGIPAAAS GVAASAAERR 
KRRRRQKDEI AGRAYADAYA DYEPEPDDEP PVRQEPRIAA TERGAGPMGF AGTVSRDAAQ 
AGGLTTLPGD PFGGGPKAPM LPGTWDPDTE PDERHNHHDG KDSQ