Gene Vapar_4134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_4134
Symbol
ID	7971871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	4375066
End bp	4376379
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	63%
IMG OID	644794720
Product	extracellular solute-binding protein family 1
Protein accession	YP_002946013
Protein GI	239817103
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGATTCA AGACGCTCGC GCTGGCATCG GCGCTGGCCG CCACCACGCT GTTCAATGTG 
GCACATGCCC AGACTGAGAT CCAGTGGTGG CACTCCATGA CCGCCGTCAA CAACGAGTGG 
GTCAACGACC TGGCCAAGCA GTTCAACGAG AGCCAGAAGG AATACAAGGT CGTGCCGACC 
TACAAGGGCA CGTACGACGA ATCGATGACG GCCTCCATTG CCGCTTTCCG TGCCGGCAAC 
GCTCCGCACA TCCTGCAGGT GTTCGAAGTG GGCACCGCCA CCATGATGGC CAGCAAGGGC 
GCCATCGTGC CGGTGGGCCA GGTCATGAAG GACGCGGGCG AGAAGTTCGA TCCGGCCGCC 
TACATTCCCG CCGTGGCCGG CTACTACACC GCGCCCAACG GCCAGATGCT GAGTTTCCCG 
CTGAACAGCT CGACGACGGT GTTCTATATC AACAAGGACG CCTTCAAGGC CGCCGGCATC 
GACACCACCA AGCTGCCCTC GACCTGGCCC GAAGTGACGG CCGCCGCGGC CAAGCTCAAG 
GCGAGCGGCC ACAAGTGCCC GTTCACCACC GCCTGGCAGG GCTGGACGCA GCTGGAGAGC 
TTCTCGGCCT GGCACAACGT CGAATTCGCG ACCAAGAGCA ACGGCCTGGC CGGGCTCGAT 
GCGCGCATGA AGATCAATTC GCCGCTGCAC GTGCGCCACA TCGAGAACCT GGCCAACATG 
GCCAAGCAGG GCCTCTTCAT CTACAAGGGC CGCGGCAATG TGCCGGAAGC CTCGTTCGTG 
TCGGGCGAGT GCGCGATGAT CAACACCTCG TCCGGCTTCT ACGGCAACGT CGCCAAGAAT 
GCCAAGTTCG CCTACGCGGT CGCTCCCCTG CCCTACTACC CGGACGTGCC CGGCGCACCG 
CAGAACACGG TGATCGGCGG CGCCAGCCTC TGGGTGATGT CGGGCAAGAA GCCGGCCGAA 
TACAAGGGCG TGGCCAAGTT CTTCAGCTTC ATCTCGACGC CTGAAGTGCA GTCGGCCAGC 
CACAAGCGCA CCGGCTACCT GCCGGTGACC ACGGCGGCCT ACAAGCTCAC CGAGGAATCG 
GGTTTCTACA AGCAGAACCC CGGCACCGAC GTGGCCGTGA CGCAGATGAT CCGCAAGGTC 
ACCGACAAGA GCCGCGGCAT CCGCCTGGGC AACTATGTGC AGATCCGCGC CATCGAGGAC 
GAAGAGCTCG AACAGGTCTG GAGCGGCAAG AAGAGCGCCA AGGAAGCCCT CGATTCGATC 
GTCACGCGCG GCAACGAACA GCTGGAACGC TTCCAGAAAG CCAACAAAAG CTAA

Protein sequence

MRFKTLALAS ALAATTLFNV AHAQTEIQWW HSMTAVNNEW VNDLAKQFNE SQKEYKVVPT 
YKGTYDESMT ASIAAFRAGN APHILQVFEV GTATMMASKG AIVPVGQVMK DAGEKFDPAA 
YIPAVAGYYT APNGQMLSFP LNSSTTVFYI NKDAFKAAGI DTTKLPSTWP EVTAAAAKLK 
ASGHKCPFTT AWQGWTQLES FSAWHNVEFA TKSNGLAGLD ARMKINSPLH VRHIENLANM 
AKQGLFIYKG RGNVPEASFV SGECAMINTS SGFYGNVAKN AKFAYAVAPL PYYPDVPGAP 
QNTVIGGASL WVMSGKKPAE YKGVAKFFSF ISTPEVQSAS HKRTGYLPVT TAAYKLTEES 
GFYKQNPGTD VAVTQMIRKV TDKSRGIRLG NYVQIRAIED EELEQVWSGK KSAKEALDSI 
VTRGNEQLER FQKANKS