Gene Mvan_0014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0014
Symbol
ID	4644541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	18488
End bp	20005
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	69%
IMG OID	639803524
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_950871
Protein GI	120401042
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.446466
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA TCCCGCACTA CCGGATGTAC ATCGACGGAG CGTGGCGTGA CGCCGCGGAC 
ACGATCGAAG TCCGCAGTCC CGCCACCGGC GAACTGGTGG CGACGGTCGC CTACGGCGGC 
GTGACCACCG TGGACGACGC GGTCGCCGCG GCCAAGGCCG CCGACGAGGC CGGGGTGTGG 
CGCAACACGT CTGCACAGCA ACGCGCGGAC GTACTCGATG CGATCGCCGA CAACCTCGCT 
GCGCGCACCG ACGAACTGAC CGCACTTCAG GTCGCCGAGA ACGGTGCCAC CGTCCGCGCG 
GCGGGCGCCT TCCTCATCGG CTACGCCATC GCGCACCTGC GGTACTTCGC CGGCCTTGCG 
CGCACCTACG CGTTCCAGTC CAGCGGACCG CTGATGGAGG CCCCGACGCT GGCCGCAGGG 
ATGATCGTCA GGGATCCGGT CGGCGTGTGC GCCGGCATGA TCCCGTGGAA CTTCCCGCTG 
CTGCTCGCGG TCTGGAAGCT GGGTCCCGCA CTCGCCGCCG GCAACACCGT CGTGCTGAAG 
CCCGACGACC AGACGCCGCT GACGCTGCTC GAGCTGGCCC GCGCCGCCGA CGAAGTCGGG 
CTCCCCGCAG GGGTTCTCAA CGTGGTCACG GGCGCCGGCC CGACCGTCGG GGCACGTCTG 
GCCGAACACC CGGACGTCCG GAAGGTGGCG TTCACCGGAT CGACCGAAGT GGGCAAGAGC 
GTCATGCGCG CGGCGGCCGA CACGGTGAAG AAGGTCACGC TCGAGCTGGG CGGCAAGGGC 
GCCAGCATCG TCCTCGACGA TGCCGACCTC GACCTGGCGG TCGACGGATC GCTGTTCGCG 
TTCCTGTTGA TGAGCGGTCA GGCCTGCGAG TCCGGAACCC GGCTGCTCGT CCACGAGTCC 
ATCCATGACG AGTTCGTCCG CCGCATGGTG GCCCGTGCCG AGACGCTGGT GATGGGCGAC 
CCGATGAGCC TCGCCTCCGA TCTGGGACCG CTGGTCTCCG CCAAGCAGAA GGCGCGGGTG 
GAGAAGTACA TCGCGCTCGG CCAGGAGGAA GGGTGCAAGC TGGCCTACCA GGGCACCGTC 
CCGACGGATC CTGCTCTGGC ACAAGGTCAT TGGGTGCCTC CGACGATCCT CACCGGCGCC 
ACCAACGACA TGCGGATCGC CCGGGAGGAG ATCTTCGGTC CCGTGCTCGT CGTGCTCACC 
TACGGTGACG ACGACGAGGC GGTCGCCATC GCGAACGACA GCGAGTACGG GCTGTCGGCC 
GGGGTGTGGA GTGCCGACAG GGAACGGGCG CTGGGGATCG CCCGCCGCCT GCAATCCGGC 
ACGGTGTGGG TCAACGACTG GCACATGATC AACGCGATGT ACCCGTTCGG CGGGGTCAAG 
CAGAGCGGTC TCGGCCGTGA ACTCGGTCCC GACGCACTCG ACGAGTACAC CGAACCGAAG 
TTCATCCACG TCGACATGAC CGACGACCGC CGCAAACACG TGTATCCGGT CGTCATCTCT 
GCGGCAGCGC AGGGCTGA

Protein sequence

MSDIPHYRMY IDGAWRDAAD TIEVRSPATG ELVATVAYGG VTTVDDAVAA AKAADEAGVW 
RNTSAQQRAD VLDAIADNLA ARTDELTALQ VAENGATVRA AGAFLIGYAI AHLRYFAGLA 
RTYAFQSSGP LMEAPTLAAG MIVRDPVGVC AGMIPWNFPL LLAVWKLGPA LAAGNTVVLK 
PDDQTPLTLL ELARAADEVG LPAGVLNVVT GAGPTVGARL AEHPDVRKVA FTGSTEVGKS 
VMRAAADTVK KVTLELGGKG ASIVLDDADL DLAVDGSLFA FLLMSGQACE SGTRLLVHES 
IHDEFVRRMV ARAETLVMGD PMSLASDLGP LVSAKQKARV EKYIALGQEE GCKLAYQGTV 
PTDPALAQGH WVPPTILTGA TNDMRIAREE IFGPVLVVLT YGDDDEAVAI ANDSEYGLSA 
GVWSADRERA LGIARRLQSG TVWVNDWHMI NAMYPFGGVK QSGLGRELGP DALDEYTEPK 
FIHVDMTDDR RKHVYPVVIS AAAQG