Gene Mvan_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0040
Symbol
ID	4644894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	51521
End bp	52831
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	69%
IMG OID	639803551
Product	hypothetical protein
Protein accession	YP_950897
Protein GI	120401068
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.480541
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTCGA CCGTGGTTGA TTCGCCTGCT GGGTGCACTC AGTCGGAGCG GCTTGAGGTG 
TTGTTCGAGG AGCTTTCGGA GTTGGCGGGG CAGCGCAATG CCATTGACGG GCGGATCGTG 
GAGATCGCCG CGCAGATCGA CCGTGACGGG CTTGTCGGGA TCACCGGGGC GCGGTCGGTG 
GCGGCGTTGG TCGCGTGGAA GACCGGGTGC TCGCCGCACA ACGCCAAGAC GATCACCACG 
GTCGCCGACC GGCTCGAGGA GTTCCCGCGC TGCGTGACGG CCTTGGGTGA GGGCCGTCTT 
TCCCTCGACC AGGTCGCGGT GATCGCCGAA CACGCCGGCC AGGGCTCTGA TGCCCATTAC 
GCGCACCTGG CGGCGAGCGC TTCGGTCAGC CAGTTGCGCA CCGCGGTCAA ATCCGAACCC 
CGACCCGATC CCGAACCGGT GCGCGATCCG TTCGCCGACG CGGACGAGGA ACCCGAACCC 
GCTCCGGTGC CCAGGCCGGA GATCACCAGC ACCTGCGACG CCGACTACAC CTACTGGCGG 
ATCAAGCTGC CGCATGAGCA GTCCGCGAGA TTCACCGCGG CCCTGCAGTC GCATAAAGAC 
CGGCTGATCG CCCAACACAC TCGCGACCAC GGCACCGACC CCACCGGCGA CGGTGACGGT 
GACCGTGGGG TGCAGCTGCC GCCGTGGCCG AGCGCCGGTG AGGCGTTCAT GGAGCTTGTC 
GAGGCCGGCT GGGATGCCGA AGCCACCCGC CGCCCGCACG GTCAGCACAC CACCGTGGTC 
GTGCACGTCG ATATCGACAC GCGGGTCGCC GCCCTGCATC TGGGTCCGCT GCTCACCGAC 
GAGGAACGTC GCTTTCTGCT CTGCGATGCC ACCTGTGAGG TCTGGTTCCA ACGCCACGGC 
CGGCCCCTCG GCACGGGACG GTCCACCCGC ACGATCAACC GCCGCCTGCG CCGTGCCCTC 
GAGCACCGCG ACCGCACCTG CGTGGTCCCC GGCTGCGGCG CGACCCGCGG CCTGCACGCC 
CATCACCTCG TGCACTGGGA AGACGGCGGC GACACCGAAC TCGACAACCT GGTCCTGGTC 
TGTCCCTACC ACCACCGAAC CCACCACCGC GGCCTGATCA CCATCACCGG ACCCGCCCAC 
CAACTGCTCG TGACCGACCA CACCGGCCGA CCACTGCAAC CGGGGTCACT GGCGCGGCCC 
CCGACCACAC CACCACCAGA GGTCAACCCC TACCCCGGAA CCTCGGGAGA ACGCGCCCAA 
TGGAAGTGGT ACCACCCCTA CCAACCCCCA CCACCAACGA GCAACAACTA G

Protein sequence

MSSTVVDSPA GCTQSERLEV LFEELSELAG QRNAIDGRIV EIAAQIDRDG LVGITGARSV 
AALVAWKTGC SPHNAKTITT VADRLEEFPR CVTALGEGRL SLDQVAVIAE HAGQGSDAHY 
AHLAASASVS QLRTAVKSEP RPDPEPVRDP FADADEEPEP APVPRPEITS TCDADYTYWR 
IKLPHEQSAR FTAALQSHKD RLIAQHTRDH GTDPTGDGDG DRGVQLPPWP SAGEAFMELV 
EAGWDAEATR RPHGQHTTVV VHVDIDTRVA ALHLGPLLTD EERRFLLCDA TCEVWFQRHG 
RPLGTGRSTR TINRRLRRAL EHRDRTCVVP GCGATRGLHA HHLVHWEDGG DTELDNLVLV 
CPYHHRTHHR GLITITGPAH QLLVTDHTGR PLQPGSLARP PTTPPPEVNP YPGTSGERAQ 
WKWYHPYQPP PPTSNN