Gene Mvan_5234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5234
Symbol
ID	4645249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	5604926
End bp	5605978
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	66%
IMG OID	639808709
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_956011
Protein GI	120406182
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.899862
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.187556
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCG ACGAGATCTA CTTCAATCCC ATCTGGGACG TCCGGATGAC CGACACCTCG 
CTGCGCGACG GGTCGCACCA CAAACGCCAC CAGTTCACCA AGGACGAGGT ACAGGCGATC 
GTCGCCGCGC TGGACGCGGC GGGGGTGCCG GTCATCGAGG TGACCCACGG CGACGGACTG 
GGCGGATCGA GCTTCAACTA CGGGTTCTCC AAGACCCCCG AGCAGGAGCT GATCAAGCTG 
GCCGCCGAGA CGGCCAAGGA ATCCAAGATC GCCTTTCTGA TGCTGCCCGG GGTGGGCACC 
AAGGAAGACA TCAAGGAAGC TCAGAGCAAC GGCGGGTCGA TCTGCCGGAT CGCCACCCAC 
TGCACCGAGG CCGATGTCTC CATCCAGCAC TTCGGCCTGG CCCGTGAACT CGGCCTGGAG 
ACCGTGGGCT TCCTGATGAT GAGCCACACC ATCCCGCCGG AGAAACTGGC CAAGCAGGCC 
CGCATCATGG CCGACGCCGG CTGCCAGTGC GTCTACGTCG TCGACTCCGC CGGCGCGCTG 
GTCCTGGAGG GCGTAGCCGA CCGGGTGGCG GCGCTGGTCG CCGAGTTGGG GTCGGATGCT 
CAAGTTGGGT TCCATGGCCA CGAGAACCTG GGTCTGGGGG TGGCGAACTC GATCGAGGCC 
GTCCGCGCCG GGGCCAAGCA GATCGACGGC TCGTGCCGCC GCTTCGGCGC CGGTGCAGGC 
AACGCGCCGG TGGAGGCGCT CATCGGGGTG TTCGACAAGA TCGGCGTCAA GACCGGCATC 
GATTTCTTCG ACATCGCCGA CGCCGCCGAG GAGGTCGTGG CGCCTGCGAT GCCGGCCGAA 
TGCCTGCTCG ACCGCAATGC GCTGATCATG GGCTACTCCG GGGTGTACTC CAGCTTCCTC 
AAGCACGCCA TCCGCCAGTC CGAGCGCTAC GGGGTGCCCG CGCACCAACT GCTGCACCGC 
GCCGGGCAGC GCAAGCTCAT CGGCGGCCAG GAAGACCAGC TCATCGACAT CGCGCTGGAG 
ATCAAGCGCG AACAGGAGAC TGCGAAGTCC TGA

Protein sequence

MSTDEIYFNP IWDVRMTDTS LRDGSHHKRH QFTKDEVQAI VAALDAAGVP VIEVTHGDGL 
GGSSFNYGFS KTPEQELIKL AAETAKESKI AFLMLPGVGT KEDIKEAQSN GGSICRIATH 
CTEADVSIQH FGLARELGLE TVGFLMMSHT IPPEKLAKQA RIMADAGCQC VYVVDSAGAL 
VLEGVADRVA ALVAELGSDA QVGFHGHENL GLGVANSIEA VRAGAKQIDG SCRRFGAGAG 
NAPVEALIGV FDKIGVKTGI DFFDIADAAE EVVAPAMPAE CLLDRNALIM GYSGVYSSFL 
KHAIRQSERY GVPAHQLLHR AGQRKLIGGQ EDQLIDIALE IKREQETAKS