Gene Avi_5053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_5053
Symbol	vdh
ID	7381210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011988
Strand	-
Start bp	44354
End bp	45802
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	62%
IMG OID	643648724
Product	vanillin: NAD oxidoreductase
Protein accession	YP_002546961
Protein GI	222106170
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.207548
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACGAAA TCCAGCAAAT CATTGGTGGC AAGAAAGTCG GAGCCTTGTC GGGCAAGACC 
TTCGACCGGA TCGATCCATT CAATGGCGAG ATTGCTTCCC GCGCCCCGGC CTCGAGCCTG 
GACGATGTCA AGGCAGCAGT TGCCGCAGCC CAGGCGGCCT TTCCCGCCTG GTCGCGCACC 
GGCCCCGGCG AAAGGCGGGC GCTGCTGCTG AAAGCCGCCG ACATCATGGC CTCGAAGGCG 
GCAGACTTCA CCGCGCTGAT GATCACGGAG ACGGGTGCAA CCGGTCCCTG GGCCGGCTTC 
AACACCATGC TTGCCGCTGG CGTATTGCGG GAAGCCGCCA GCATGACCAG CCAGATCCAG 
GGCGAAGTCA TCCCCTCCGA CAAGCCCGGT ACATTGTCCA TGGCGGTGCG CCAGGCAGCA 
GGCGTCTGCC TTGGCATTGC GCCCTGGAAC GCACCAATCA TTTTGGGCAC ACGCGCCATT 
GCCATGGCAA TTGCCTGCGG CAACAGCGTC ATCCTGAAGG CATCCGAAGC CTGCCCCGGC 
GTTCACGTCC TGATCGGCCA GGTGCTGGTC GAAGCTGGCC TGCCGGATGG CGTCATCAAT 
GTCATCACCA ATGCGCCTGA AGATGCTGCC CAGGTGGTGG AGGCGCTGGT CAGCGCACCG 
GAAGTTCGCC GCGTCAATTT CACCGGTTCC ACCAAGGTCG GACGCATTAT CGGCGAATTG 
TGCGGTCGCC ACCTGAAGCC CGCCCTGCTT GAACTCGGCG GAAAAGCACC CTTTCTGGTG 
CTCGAAGATG CCGATATCGA CGCTGCCGTC AATGCGGCGG TGTTTGGCTG CTACATGAAC 
ATGGGCCAGA TCTGCATGTC CACGGAGCGG TTGATTGTCC ACGAAAAGGT CGCCGACGAA 
TTCGTGGCAA AGCTGGCCGC CCGGGCAGCC TCGCTTCCCG CTGGCGATCC GCGCGGCCAT 
GTCGTGCTGG GCTCGCTGGT TAATCCTCAG GCCGCCATCA AAATGCAGGA ATTCATCGAC 
GATGCCGTCG GCAAGGGCGC AACCCTCGCG GCTGGCGGCA AGGTCACGGG CAGCGTGGTG 
GAAGCGACGC TTCTCGACCA TGTCACATCA GGAATGCGCA GTTTCGATGA GGAAAGCTTC 
GGCCCGGTCA AGCCGGTCAT CCGGGTCAAG GACGAGGAAG AGGCCATCCG CATCGCCAAT 
GACAGCGAAT ACGGCCTGTC CTCGGCGATT TTCAGCCGCG ATATCCAACG CGCCCTGGCG 
ATTGCGGCCC GTATCGAAGC CGGCATTTGC CATATCAACG GCCCGACCGT TGCCGATGAG 
GCGCAAATGC CGTTTGGCGG TGTGAAAAGC TCCGGTTTCG GTCGGTTCGG CGGCAAGGCG 
GCGATCAACG AATTCACCGA CCTGCGCTGG ATCACCATCG AAGATCCGAA CCAGCACTAT 
CCGTTCTGA

Protein sequence

MHEIQQIIGG KKVGALSGKT FDRIDPFNGE IASRAPASSL DDVKAAVAAA QAAFPAWSRT 
GPGERRALLL KAADIMASKA ADFTALMITE TGATGPWAGF NTMLAAGVLR EAASMTSQIQ 
GEVIPSDKPG TLSMAVRQAA GVCLGIAPWN APIILGTRAI AMAIACGNSV ILKASEACPG 
VHVLIGQVLV EAGLPDGVIN VITNAPEDAA QVVEALVSAP EVRRVNFTGS TKVGRIIGEL 
CGRHLKPALL ELGGKAPFLV LEDADIDAAV NAAVFGCYMN MGQICMSTER LIVHEKVADE 
FVAKLAARAA SLPAGDPRGH VVLGSLVNPQ AAIKMQEFID DAVGKGATLA AGGKVTGSVV 
EATLLDHVTS GMRSFDEESF GPVKPVIRVK DEEEAIRIAN DSEYGLSSAI FSRDIQRALA 
IAARIEAGIC HINGPTVADE AQMPFGGVKS SGFGRFGGKA AINEFTDLRW ITIEDPNQHY 
PF