Gene Vapar_1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_1043
Symbol
ID	7972014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	1140773
End bp	1142224
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	71%
IMG OID	644791639
Product	Aldehyde Dehydrogenase
Protein accession	YP_002942960
Protein GI	239814050
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.414752
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATTCACG GCGAGATCCA TCAGAACGTG CGGCAATACA TCAACGGCCG CTGGGAAACC 
AGCGCGACCA CCGGTGTGAG CGCCAATCCT TCGGACACCA GCGAAGTGGT GGCCGAATAC 
GCACGGGCCG ATCGCCGCCA GGTGGAGTCC GCGATCCGCG CAGCCGCCGA TGCCTTTTCC 
CACTGGAGCC ACAGCACGCC GCAGCGCCGG GCCGACGTGC TCGACCGCAT CGGCACCGAA 
CTCCTGGCGC GCAAGGACGA GCTGGGCCTG CTGCTGGCGC GCGAGGTTGG CAAGACCCTG 
CCCGAGGCGG TGGCCGAGGC GGCGCGCGCG GGGCAGGTGT TCAAGTTCTT CGCGGGCGAG 
GCACTGCGCG GCGGCGGCGA GAACATGGCC TCGCTGCGCG CAGGCGTGCA GGTCGACGTC 
ACGCGCGAGC CGGTGGGCGT GGCCGGGCTC ATCACGCCGT GGAATTCGCC GCTCGCGGTG 
CCGGCCACCA AGATTGCACC GGCGCTCGCG CACGGCAACT GCGTGGTGTT CAAGCCGGCC 
GAGCTGGTGC CGGCCTGCGG CTGGACGCTG GCCGAGATCA TCAGCCGCGC GGCACTGCCC 
GCGGGCGTGT TCAACCTCGT GATGGGCAGC GGCCGCGAAG CCGGCCAGGC GCTGGTCGAC 
AGCCCGCTGG TCGATGCCCT GAGCTTCACC GGCTCGGCGC GCAACGGCGA ACGCATCCTG 
CAGGCGGCCG CCGCGCGGCG CGCCAAGGTG CAGCTCGAGA TGGGCGGCAA GAACGCGCTC 
GTGGTGCTGG CCGATGCCGA CATCGACCAC GCGGTCGACT GCGCGGTGCA GGGCGCCTAT 
TTTTCCAACG GCCAGCGCTG CACGGCGTCG AGCCGGCTGA TCGTCGAGGC CGCGGTGCAC 
GATGCCTTCG TCTCGCGGCT TCGCGAGCGG CTCAAGGCGC TGAAGATCGG CCATGCGCTC 
GAACGCGGCG TCGACGTCGG GCCGCTGGTC GATGAAGAGC GCCTCGCGCG CAGCCTGGCC 
TGGGTCGGCA TTGCGCGCGA AGAGGGCGCT GAGCATGTGT GGGGCGGCGA GCCGCTCCAG 
CGCGCCACGG CCGGCCACTA CATGAGCCCC GCGCTGTTCC TGGCCCAGCC CGGGCACCGC 
ATCGCGCGCG AGGAAATCTT CGGCCCGCTG GCCTGCGTGC TGCGCGCGGC CGACTACGAC 
GAGGCGCTGG CGCTGTGCAA CGACACGCCT TCGGGCCTGA GCGCGGGCAT CTGCACCAAT 
TCGCTCAAGC ACGCGATGCA TTTCAGGCGC CATGCCGAAG TCGGCATGAC GATGGTCAAC 
CTGCCGACGG CGGGCGTGGA CTTCCACGCG CCCTTCGGCG GGCGCAAGGG GTCGGGCTAC 
GGGCCGCGCG AACAAGGGCG CCATGCCGCG GAGTTCTACA CGACGGTCAA GACCGGCTAC 
ATGCTGGCCT GA

Protein sequence

MIHGEIHQNV RQYINGRWET SATTGVSANP SDTSEVVAEY ARADRRQVES AIRAAADAFS 
HWSHSTPQRR ADVLDRIGTE LLARKDELGL LLAREVGKTL PEAVAEAARA GQVFKFFAGE 
ALRGGGENMA SLRAGVQVDV TREPVGVAGL ITPWNSPLAV PATKIAPALA HGNCVVFKPA 
ELVPACGWTL AEIISRAALP AGVFNLVMGS GREAGQALVD SPLVDALSFT GSARNGERIL 
QAAAARRAKV QLEMGGKNAL VVLADADIDH AVDCAVQGAY FSNGQRCTAS SRLIVEAAVH 
DAFVSRLRER LKALKIGHAL ERGVDVGPLV DEERLARSLA WVGIAREEGA EHVWGGEPLQ 
RATAGHYMSP ALFLAQPGHR IAREEIFGPL ACVLRAADYD EALALCNDTP SGLSAGICTN 
SLKHAMHFRR HAEVGMTMVN LPTAGVDFHA PFGGRKGSGY GPREQGRHAA EFYTTVKTGY 
MLA