Gene Vapar_3939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_3939
Symbol
ID	7970368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	4178674
End bp	4179732
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	67%
IMG OID	644794525
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_002945819
Protein GI	239816909
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000297127
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAA CCAAGGCCTT GAGGTCCGCG TTCGTCACCG GCGCGACCGG CCTTCTCGGC 
AACAACCTGG TGCGCGAACT GGTCGCGCGC GGCGTCTCGG TCAAGGCCCT TGTCCGCTCG 
AAGGCCAAGG GCCAGCAGCA GTTTGCGGGC GTGAAGGGCG TCGAACTGGT GCTGGGCGAC 
ATGGCCGATG CGCCCGCCTT CGCCGGCGCG CTGCAAGGCT GCGACGTGGT GTTCCACACC 
GCCGCGTTCT TCCGGGACAA CTTCAAGGGC GGCAGCCACT GGCAAGAGCT CAAGCGCATC 
AATGTGGACG GCACGCGGCA GCTCATCGAG CAGGCCTACG GTGCGGGCAT CCGGCGCTTC 
GTCCAGACCT CGTCCATCGC GGTGCTCAAC GGCGAGCCGG GCGTGCCCAT GGACGAGACC 
TGCCTGCGCG AGCTGGCCGA CGCCGGCGAC GACTACTACC GCAGCAAGAT CATGGCCGAC 
CAGGTCGTGT CGGCCTTTCT GGGCACGCAC CCGGACATGC ATGCGAGCTT CGTCCTGCCC 
GGATGGATGT GGGGACCGGC CGATATCGGC CCCACCTCGT CAGGACAATT CGTCAATGAC 
GTGGTGCTCG GAAAACTGCC CGGGCTGGTG CCCGGCAGTT TTTCCGTCGT CGACGCCCGC 
GATGTGGCCA GGGCGCAGAT CTCGGCCGCG GAGCACGGGC AGCGCGGCGA ACGCTACCTG 
GCGGCCGGCC GCCACATGAC GATGCAGGAA CTGGTTCCCC TGGTGGGAAA GATCGCAGGC 
ATCAAGACGC CGACGCGCCA TTTGCCCTTT CCGCTCCTGT ATCTGCTGGC GGCGGTGCAG 
GAGCTCTACG CGCGGACCAC CGGCAAGCCC ATCCTGCTCA GCCTGGCCAC CGTGCGGCTG 
ATGCGCAAGG AGGCGGGGCG CAGCCATTTC AATCACACGA AGAGCGAGCA GAAGCTTCAG 
CTGAAGTTTC GCCCGGTCGA GCAGACCGTT GCCGACACGC TCGCCTGGTA TCGCGGCAAT 
GGCTGGCTGC CCGGTGTGCC GGCCCGAACC GAATCCTGA

Protein sequence

MEKTKALRSA FVTGATGLLG NNLVRELVAR GVSVKALVRS KAKGQQQFAG VKGVELVLGD 
MADAPAFAGA LQGCDVVFHT AAFFRDNFKG GSHWQELKRI NVDGTRQLIE QAYGAGIRRF 
VQTSSIAVLN GEPGVPMDET CLRELADAGD DYYRSKIMAD QVVSAFLGTH PDMHASFVLP 
GWMWGPADIG PTSSGQFVND VVLGKLPGLV PGSFSVVDAR DVARAQISAA EHGQRGERYL 
AAGRHMTMQE LVPLVGKIAG IKTPTRHLPF PLLYLLAAVQ ELYARTTGKP ILLSLATVRL 
MRKEAGRSHF NHTKSEQKLQ LKFRPVEQTV ADTLAWYRGN GWLPGVPART ES