Gene Vapar_3689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_3689
Symbol
ID	7973922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	3889601
End bp	3891337
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	67%
IMG OID	644794273
Product	dihydroxy-acid dehydratase
Protein accession	YP_002945571
Protein GI	239816661
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACTT CCCCCAAGAA AAAACCCGAA GACCTGCGCA GCCAGCAATG GTTCGGCCGC 
CACGACCGCG ATGGCTTCAT CTACCGCAGC TGGGTCAAGG GCAAGGGCGT GCCGCACGAC 
CAGTTCGACG GGCGCCCGGT CATCGGCATC TGCAACACCT TCAGCGAGCT CACGCCCTGC 
AACTCGCACT TCCGCACGCT CGCCGAGCAG GTGAAGATCG GCGTCTACGA AGCGGGCGGC 
TTTCCGCTCG AATTCCCGGT GATGTCGCTC GGCGAAACGC TCTTGCGCCC CACCGCCATG 
CTGTACCGCA ACCTCGCGAG CATGGACGTG GAAGAAAGCA TCCGCGGCAA TCCGCTGGAC 
GGCGTGGTGC TGCTCATGGG CTGCGACAAG ACCACGCCCG CGCTCATGAT GGGTGCGGCC 
AGCGTCGACC TGCCGACCAT CGGCGTCTCC GGCGGCCCGA TGCTTTCGGG CAAGTGGCGC 
GGCCAGGAAC TGGGCTCGGG CACCGGCGTG TGGCAGATGA GCGAGCAGGT GCGCGCCGGC 
ACGCTCAAGC TGCAGGACTT CTTCGAGGCC GAGAGCTGCA TGCACCGCAG CCACGGCCAC 
TGCATGACCA TGGGCACCGC CAGCACCATG GCCAGCATGG TCGAGTCGCT GGGCATCGGC 
CTGCCCGGCA ACGCCGCCTA CCCGGCGGTG GACGGCCGGC GCAACGTGCT CGCGCGCATG 
GCGGGGCGGC GCATCGTCGA CATGGTCCAT GAAGACCTCC ACATGTCGAA GATCCTCACG 
CGCCAGGCCA TCGAGAACGC CATCAAGGTC AACGCCGCCA TCGGCGGCTC CACCAACCTC 
GTCATCCACC TGCTGGCCAT TGCGGGGCGC ATCGGCGTCG ATCTTTCGCT GGACGACTTC 
GACCGCCTGG CCTCGGACCT CCCCTGCCTG GTCGACCTGC AGCCTTCGGG CCGCTTCCTG 
ATGGAAGACT TCTGCTATGC GGGCGGGCTG CCGGTGGTCA TCAAGGAGAT CGCGCAGTAC 
CTGCACAAGG ATGTGATCAC GGCCAACGGC CAGACACTGT GGGACAACGT GAAGGACGCC 
GAGAACTACA ACCCGCAGGT GATCCGCCCG CTGGCCGAGC CCTTCAAGGA CAAGGCCGGC 
ATCTGCGTGC TGCGCGGCAA TCTCGCGCCC AACGGCGCCA TCATCAAGCC CAGTGCCGCC 
ACGCCCGAGC TGCTGGTGCA CAAGGGCCGC GCGGTGGTGT TCGAAAGCGC CGACGACCTG 
CACAAGCGCA TCGACGACGA GAACCTCGAC ATCGACGAGC ACTGCGTGAT GGTGCTGAAG 
AACTGCGGCC CGCGCGGCTA TCCGGGCATG GCCGAGTCGG GCAACATGCC GCTGCCGCCG 
AAAGTGCTGC GCAAGGGCAT CACCGACATG GTCCGCATCA GCGACGCGCG CATGAGCGGC 
ACGGCCTACG GCACGGTGGT GCTGCACACG GCGCCCGAGG CGGCCGCGGG CGGACCGCTC 
GCGCTGGTGC AGGACGGCGA CATCGTCGAG CTGGACGTGC CCAACCGCAA ACTGCACCTG 
CACGTGAGCG ACGAAGAGCT CGCCAGGCGG CTCGAGAAGT GGGTCGCGCC CAAGGCGCCG 
CTCGATTCGG GTTACTGGAA GCTGTACGTC GACACGGTGC TGCAAGCCGA CCAGGGCGCC 
GACCTGGCCT TCCTGCGTGG TCGCCGCGGG GCCTTCGTGC CGCGCGACAA TCACTGA

Protein sequence

MSTSPKKKPE DLRSQQWFGR HDRDGFIYRS WVKGKGVPHD QFDGRPVIGI CNTFSELTPC 
NSHFRTLAEQ VKIGVYEAGG FPLEFPVMSL GETLLRPTAM LYRNLASMDV EESIRGNPLD 
GVVLLMGCDK TTPALMMGAA SVDLPTIGVS GGPMLSGKWR GQELGSGTGV WQMSEQVRAG 
TLKLQDFFEA ESCMHRSHGH CMTMGTASTM ASMVESLGIG LPGNAAYPAV DGRRNVLARM 
AGRRIVDMVH EDLHMSKILT RQAIENAIKV NAAIGGSTNL VIHLLAIAGR IGVDLSLDDF 
DRLASDLPCL VDLQPSGRFL MEDFCYAGGL PVVIKEIAQY LHKDVITANG QTLWDNVKDA 
ENYNPQVIRP LAEPFKDKAG ICVLRGNLAP NGAIIKPSAA TPELLVHKGR AVVFESADDL 
HKRIDDENLD IDEHCVMVLK NCGPRGYPGM AESGNMPLPP KVLRKGITDM VRISDARMSG 
TAYGTVVLHT APEAAAGGPL ALVQDGDIVE LDVPNRKLHL HVSDEELARR LEKWVAPKAP 
LDSGYWKLYV DTVLQADQGA DLAFLRGRRG AFVPRDNH