Gene Vapar_3687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_3687
Symbol
ID	7973920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	-
Start bp	3887216
End bp	3888601
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	62%
IMG OID	644794271
Product	extracellular solute-binding protein family 1
Protein accession	YP_002945569
Protein GI	239816659
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTCG TCAAGTCGCT GATAGCGCCG ACGTTGTTCG CGCTGGGGTT GTTGGCGTCG 
GCAGGTCCCG CCGCCGCGCA GGAAAAGCTC ACCGTCTGGT GGGTCAAGGG CTTCTACAAG 
GCCGAGGACG ATGCGTTGTT TGCGGCCATC AAGAAGTTCG AGGACAAGAA CAAGGACGTG 
AAGATCGAGC TGTCGCAGTA CCCGATCCAG GACATGATTC CCAAGACCGT GTCCGCGCTC 
GACTCCGGCA GCCCGCCCGA CGTGGCGTAT GCCGACGTGT ACGACTTCCA GGTCACGGGC 
AAGTGGGCCT ACGACGGCAA GCTCGAGGAC ATCGGCAGCG TGCTCGCGCC CATGAAGGAC 
CGCTTCGCGC CCAACACGCT CGAGACCGCC TTCCTCTACA ACGACCAGAC CAAGAAGAAG 
GCCTACTACG CGTTCCCGAT CAAGCAGCAG ACGATGCATA TCGAGTACTG GAACGACATG 
CTCAACGAGG CCGGGTTCAA GGAGTCCGAC ATCCCCACCG CCTGGAAGGA CTACTGGTCG 
TTCTGGTGCG AGAAGGTGCA GTCCGGCAGC CGCAAGCAGA CCGGCAAGCG CACCTTCGGC 
ATCGGCATGC CGATGGGCGT GGATTCGAGC GATTCCTTCT ATTCGTTCCT GACCTTCATG 
GACGCCTACA ACGTCAAGCT GGTGGCCGAC AGCGGCAAGC TGCTGGTGGA CGACCCCAAG 
GTGCGCGCCG GCCTGATCAG CGCCTTGACC GACTACACCA CGCCCTACAC GAAGGGCTGC 
ACGCCGCCCT CGTCGACCAG CTGGAAGGAC CCGGACAACA ACGTCGCCTT CCACAACAAG 
ACGACCGTGA TGACGCACAA CGCGACCATC TCCATTGCCG CCAAGTGGCT CGACGATTCG 
AACAACGCCT CGCTCACGCC CGAGCAGCGC GAGGAAGCGC GCAAGAACTA CACCGAGCGC 
ATCCACACGG CGGGCTTTCC GAACAAGCCT GACGGCAGCA AGATGGTCTA CCGCTCCGCG 
GTGAAGACCG GCGTGGTGTT CAAGGACGCC AAAAACAAGG CGCGCGCCAA GGAGTTCGTT 
GCCTTCCTCA TGCAGGAAGA GAACCTCACG CCGTACGTCG AGGGTTCGCT CGGCCGCTGG 
TTCCCGGTGA CCAAGGCCGC GCAGGCGAGC CCGTTCTGGA AGGCCGACCG CCATCGCCTG 
TCGGTGTTCA ACCAGTACGC CGCCGGCACC GTGACCTTCG AGTTCACCAA GAACTACAAG 
TTCACCGTGC TCAACAACGA GAACGTCTGG GCCAAGGCCA TGAGCCGCGT CGTCACCGAC 
AAGGTGCCGG TGGACAAGGC GGTCGACGAG CTGATCGCGC GCATCAAGAC GGTCGCGGCG 
CAGTAA

Protein sequence

MKVVKSLIAP TLFALGLLAS AGPAAAQEKL TVWWVKGFYK AEDDALFAAI KKFEDKNKDV 
KIELSQYPIQ DMIPKTVSAL DSGSPPDVAY ADVYDFQVTG KWAYDGKLED IGSVLAPMKD 
RFAPNTLETA FLYNDQTKKK AYYAFPIKQQ TMHIEYWNDM LNEAGFKESD IPTAWKDYWS 
FWCEKVQSGS RKQTGKRTFG IGMPMGVDSS DSFYSFLTFM DAYNVKLVAD SGKLLVDDPK 
VRAGLISALT DYTTPYTKGC TPPSSTSWKD PDNNVAFHNK TTVMTHNATI SIAAKWLDDS 
NNASLTPEQR EEARKNYTER IHTAGFPNKP DGSKMVYRSA VKTGVVFKDA KNKARAKEFV 
AFLMQEENLT PYVEGSLGRW FPVTKAAQAS PFWKADRHRL SVFNQYAAGT VTFEFTKNYK 
FTVLNNENVW AKAMSRVVTD KVPVDKAVDE LIARIKTVAA Q