Gene Mvan_1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_1031
Symbol
ID	4644252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	1082378
End bp	1083976
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	71%
IMG OID	639804532
Product	aldehyde dehydrogenase
Protein accession	YP_951875
Protein GI	120402046
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.576892
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCCA CGATCTCGGG CGCCACCAGC CTCACCGGAC AGATGCTGAT CGCCGGGGCA 
CCTGTGCGGG GCACCGGCAA GGAGGTCCGC GCATTCGATC CCGCGGCCGG GCAACCGCTG 
GAACCGGTGT ACCAGCACGG CGACAACACC CACGTCGACG CCGCATGCGC TGCGGCCGCC 
GACGCGTTCG CGCAATACCG CGCCACCACA TCGGAGCAGC GCGCCGCGTT TCTCGACACG 
ATCGCCACCA ACATCGAGGC CGTCGGCGAG GCGCTGATCG CCCGCGCCGT CGCCGAATCC 
GGACTGCCGC AGGCCAGGAT CACCGGCGAG CTCGGCCGCA CCACCGGACA GCTGCGCCTG 
TTCGCCTCGG TGCTGCGCGA GGGCAGCTGG AACGGTGCCC GCATCGACAC CGCGCTGCCC 
GACCGGACCC CGCTGCCGCG CCCCGACCTC CGTCAGCGCC ATATCCCGCT CGGTCCCGTC 
GCGGTGTTCA GCGCGTCGAA CTTCCCGCTG GCGTTCTCCG TCGCCGGCGG TGACACCGCC 
TCGGCGCTGG CTGCCGGCTG CCCGGTCGTC GTCAAAGGAC ACGACGCGCA TCCCGGCACC 
TCCGAGCTCG TCGCCCGCGC CGTCACCGAC GCCGTCACCA CCTCCGGACT GCCCGCGGGA 
ACGTTCTCGC TGCTGTTCGG CTCCGGCCCC GGTCTCGGCA TCGCACTGGT CACCGATCCG 
CGCATCAAGG CCGTCGGTTT CACCGGATCA CGTTCCGGCG GAATGGCCCT CGTCTCCGCC 
GCGGCGGCAC GTCCCGAACC CATCCCGGTG TATGCCGAGA TGAGCTCCAT CAACCCGGTG 
TTCGTGCTCG ACGGTGCGCT GAAAACCCGC GGCGCCGAGC TGGGCCGCGC GTTCGTCGCG 
TCGCTGACGA TGGGTTCCGG CCAGTTCTGC ACCAACCCCG GACTGGTGAT CGCCGTCGAC 
GGACCCGGGC TGGACACATT CGCCGCCGCC GCTCGTGACG CACTGGCCGG CTCGCCGGCC 
ACCCCGATGC TGACCCCGAC CATCGCGCGC AGCTACGCCT CCGGTGTGGA GGCGCTGTCC 
GGTGCCGCGC AGCTTGTCGG CCGCGGCGCG CCCGGTACCA GTGAAACTGC TTGCCACGCC 
GCGCTGTTCA GCACCGATGC GCAGACCTTT CTGGCGTCGG AGGCATTACA GGCCGAGGTG 
TTCGGCTCGT CGAGCCTGAT CGTGCGTTGC GCCGACTTCG AGCAGATGCG CGCCGTCGCC 
GAGGGCATCG AAGGACAGCT CACCGCGACC GTGCACGCCG ACGACTCCGA CCTCGACGAC 
GCGGGCCGGC TGCTGCCACT GCTGGAACTC AAGGCAGGTC GGATCCTGTT CGGCGGCTGG 
CCGACCGGCG TCGAGGTCTG CCACGCGATG GTGCACGGCG GACCGTTCCC GGCCACGTCG 
GACTCGCGCA GCACCTCGGT CGGTTCGCAG GCCATCGAAC GCTATCTGCG GCCCGTCTGC 
TATCAGGACG TGCCGGCCCC GTTGCTGCCC AGCGCGATCG CCGAAGGAAA CCCCGAAAAG 
CTGTGGCGGC GCGTCGACGG CCGACTCACC CAAGACTGA

Protein sequence

MTATISGATS LTGQMLIAGA PVRGTGKEVR AFDPAAGQPL EPVYQHGDNT HVDAACAAAA 
DAFAQYRATT SEQRAAFLDT IATNIEAVGE ALIARAVAES GLPQARITGE LGRTTGQLRL 
FASVLREGSW NGARIDTALP DRTPLPRPDL RQRHIPLGPV AVFSASNFPL AFSVAGGDTA 
SALAAGCPVV VKGHDAHPGT SELVARAVTD AVTTSGLPAG TFSLLFGSGP GLGIALVTDP 
RIKAVGFTGS RSGGMALVSA AAARPEPIPV YAEMSSINPV FVLDGALKTR GAELGRAFVA 
SLTMGSGQFC TNPGLVIAVD GPGLDTFAAA ARDALAGSPA TPMLTPTIAR SYASGVEALS 
GAAQLVGRGA PGTSETACHA ALFSTDAQTF LASEALQAEV FGSSSLIVRC ADFEQMRAVA 
EGIEGQLTAT VHADDSDLDD AGRLLPLLEL KAGRILFGGW PTGVEVCHAM VHGGPFPATS 
DSRSTSVGSQ AIERYLRPVC YQDVPAPLLP SAIAEGNPEK LWRRVDGRLT QD