Gene Mvan_5194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5194
Symbol
ID	4645711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	5559683
End bp	5560633
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	71%
IMG OID	639808669
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_955971
Protein GI	120406142
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.524902
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0880235
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGGCGC TGCTGGAGGC GCAGCACACG ATTCGGCTGC TGGTTCTACC CCAGGAGCAG 
GACGCCCCGG TGATCCGCCG GTTGCGCTCG CTGGGCGACG TCTCGGTGAT CGTCGGGGAC 
GTGCGCGCGG AGTCCACCGT CACCGCGCTG CTCACCGGGG TGGACGCCGT CGTGCATGCG 
GCGGGGGTGG TCGGGACGGA CGAACGTCGC GCGCAACTGA TGTGGGACAT CAACGCCTAT 
GCGACCGAGC AGGTCCTGAC CCGGGCCGTC GAACTCGGCC TCGACCCGGT GGTGTCGGTG 
AGCAGCTACA GCGCACTGTT CCCGCCGCCG GACGGCATCA TCTCGGCGGA TTCACCCACC 
TCATCCGGCC GCAGCAGCTA CGCCAAGACG AAGGGCTACG CCGACCGGGT CGCGCGGCGA 
CTGCAGGACG CGGGCGCCCC TGTGGTGGTG ACCTATCCGT CGAGCGTCGT CGGGCCGGCG 
TTCGGAACCG CTGCGGGCGT GACCGAACGC GGATGGGAGC CCATCGTGCG CGCGCGGGTC 
GCGCCGCGGG TCCGGGCGGG CATGCAGATG ATCGACGTGC GTGACGTGGC GGACGTGCAC 
GTGCGCCTGA TGCGGCCGGG ACGCGGTCCG CGCCGCTACG TGTGCGGGGG CGTGATGCTG 
ACGTTCGACG AGATGATCGA CGCGCTGGAG GCCGGACTCG GCCGCCCGGT GCGGCGTGTG 
CCGCTGTCGC CGAAGGTGCT GCTGGCGGTG GGACGGCTTT CCGACGCCGT GGGTCGCTAC 
GTGCCGCTCG GGGACGGGCT CAGTTACGAG GCCGCCCTGC TTCTCACTTC GGCCACGCCG 
ACCGATGACC GCGCCACCAC AGAGGATCTC GGCCTGCATT GGCGCTCGCC GCGGCAGGCC 
ATCATCGAAT CGTTCGGCGT CGCCGGACGT CTGGGCGATC CGGTCTCCTA G

Protein sequence

MRALLEAQHT IRLLVLPQEQ DAPVIRRLRS LGDVSVIVGD VRAESTVTAL LTGVDAVVHA 
AGVVGTDERR AQLMWDINAY ATEQVLTRAV ELGLDPVVSV SSYSALFPPP DGIISADSPT 
SSGRSSYAKT KGYADRVARR LQDAGAPVVV TYPSSVVGPA FGTAAGVTER GWEPIVRARV 
APRVRAGMQM IDVRDVADVH VRLMRPGRGP RRYVCGGVML TFDEMIDALE AGLGRPVRRV 
PLSPKVLLAV GRLSDAVGRY VPLGDGLSYE AALLLTSATP TDDRATTEDL GLHWRSPRQA 
IIESFGVAGR LGDPVS