Gene Mvan_4227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4227
Symbol
ID	4645912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	4534636
End bp	4535706
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	68%
IMG OID	639807694
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_955010
Protein GI	120405181
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.77425
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGGTA CATCCGGTAC CGTGCTCGTC ACCGGAGGCT TCGGGCTCGT CGGCTCGGCA 
ACGGTCCGTC GACTTGTCGA GTTGGGCCGC AGCGTCGTGG TCGCCGATCT CGACACCCCG 
GCCAACCGCG CGTCGGCCGC TCAGCTGCCT GCCGGCGTCA CGGTCCGCTG GACCGATCTC 
ACCGACGCCG AACAGACTTC CGCATTGGTT TCCGAGGTCG CGCCCGCGGT GATCATCCAC 
CTCGCGGCGA TCATCCCGCC GGCGATCTAC AAGAATCGCG CCCTCGCCCG GCGCGTCAAC 
GTCGAAGCGA CCGCGACGCT CGTGCGTATC GCGGAGGCTC AGCCCACTCC CCCGCGTTTC 
GTCCAGGCGT CCAGCAACGC GGTGTACGGC GCACGCAACC CGTACAAGTC GGCCGGTCCG 
GTCACCGCCG ACATGCCGAT GAAGCACTCC GATCTCTACA GCGCGCACAA GGCCGAGGCC 
GAGGCGATCG TGCGCGCCTC GTCGCTGGAG TGGGTGGTGC TACGTCTGGG CGGGGTGCTC 
AGCACGGATC CCAACGCCAT TCCGTTCAGC GCGGATGCGC TGTACTTCGA GAGCGTGCTT 
CCCGCTGACG GCCGAATACA CACGGTCGAT GTGCGCGATG TGGCATGGGC TTTCGCCGCG 
GCGACGACGG CCGATGTGGC TCGTGAGATC CTGTTGATCG CCGGCGACGA CTCGCATCGC 
GTGCTTCAAG GTGACGTCGG CCGCGCGCTG GCCGAATCGC GCGGCCTCAA GGGTGGCCTG 
GTGCCGGGCC GCAACGGCGA CCCCAACAGC GACGAGAACT GGTTCGTCAC CGACTGGATG 
GACACCCGCC GCGCGCAGGA AGCCCTACAG TTCCAGCACT ATTCGTGGCA GAACATGCTC 
GATGAGGCCC AGCGGCGTGC CGGCGCCTCG CGCTATGTGC TGCCGGTGTT CGCGCCGCTG 
GTGCGGGCAG TTCTCAAGCG GCGCTCGGCC TACTGGAAGC AGCCCGGCCA GTACGCCGAT 
CCGTGGGGCG CGATCAAGCG CGGGATCGGC GACCCGTCGC CCGATTCGTA G

Protein sequence

MSGTSGTVLV TGGFGLVGSA TVRRLVELGR SVVVADLDTP ANRASAAQLP AGVTVRWTDL 
TDAEQTSALV SEVAPAVIIH LAAIIPPAIY KNRALARRVN VEATATLVRI AEAQPTPPRF 
VQASSNAVYG ARNPYKSAGP VTADMPMKHS DLYSAHKAEA EAIVRASSLE WVVLRLGGVL 
STDPNAIPFS ADALYFESVL PADGRIHTVD VRDVAWAFAA ATTADVAREI LLIAGDDSHR 
VLQGDVGRAL AESRGLKGGL VPGRNGDPNS DENWFVTDWM DTRRAQEALQ FQHYSWQNML 
DEAQRRAGAS RYVLPVFAPL VRAVLKRRSA YWKQPGQYAD PWGAIKRGIG DPSPDS