Gene Vapar_4355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_4355
Symbol
ID	7970546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	4600868
End bp	4602355
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	66%
IMG OID	644794944
Product	extracellular solute-binding protein family 5
Protein accession	YP_002946232
Protein GI	239817322
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0355555
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGAACC GTCGCACCCT CCTTGCCACC GCCGGCGCCA CCGTGGCGCT GGCCTCTCCC 
ATCGCCGGCA TGGCGCAGGG GCGGAAGGAC GCCATCGTGA TCGGCATGGC GCTCGAGCCG 
CCGGGCCTGG ACCCGACCGC CGGCGCCGCG GCCGCCATCG CGGAAGTGGT GCACTACAAC 
ATCCTGGAGA CGCTCACCAA GATCAACGCC GACGGCAGCG TCACGCCGCT CCTGGCCGAG 
AGCTGGGAAA TCTCGCCCGA CCTGAAGACC TACACCTTCA AGCTGCGGCG CGGCGTCAAG 
TACCAGAACG GCGAGCCCTT CAATGCCGCC GCGGTGAAAT TCTCCTTCGA CCGCGCCGGC 
GGCGAGAAGA GCACCAACAA GGACAAGCGC ACCTTCGCGA ACCTGAGCAC GCAGGTGGTC 
GACGACTACA CCGTGGTGGT CATCAACAAG GAAATCGACC CCGACCTGCC CTTCGTGCTG 
GGCCAGGCCA CGGCCGTGAT CGTCGAGCCC AAGAGCGCCG ACGGCAACGC CACCAAGCCG 
GTCGGCACCG GCCCCTACAA GCTCGACAAC TGGGCCAAGG GCTCGTCGAT CACGCTGAGC 
AAGTGGGAGG GCTTCCGCAG CCCGGCCACG GCCAGGATCA ACAAGGTCAC CTTCCGCTTC 
ATTTCCGACA CGGCCGCGCA GGCCGCCGCG CTGATGGCCG GCGACGTCGA CGTGTTCACG 
CGCATCGGCA CGCGCGCGGT GCCGCAGTTC AAGATGAACC CGCAGTTCCA GGTGATCCTG 
GCCGGCTCGC GCGCCAAGAC CATTCTGTCG ATCAACAACA AGAAGAAGCC GCTGGACGAC 
GTGCGCGTGC GCCGCGCCAT CCTGGCGGCC ATCGACCGCA AGGCCGTGAT CGAAGGCGCG 
GCCGACGGCT TCGGCGTGCC GATCGGCAGC CACTACGTGC CGGGCGCCGC AGGCTATGTC 
GACACCACGG GCATCAACCC CTTCGACCTC GAGAAGGCCA AGAAGCTGAT GGCCGAGGCC 
GGCGTGAAGA CGCCGCTCGA ACTCACCATG ACGCTGCCGC CGCCGCCCTA CGCACGCCAG 
GGCGGCGAGG TGATCGTGGC GCAGCTCGCC AAGATCGGCA TCACGGTCAA GGTGCAGAAC 
GTGGAGTGGG CGCAGTGGCT CAGCGGCACC TACGGCAACA AGGACTACGA CCTGTCGATC 
GTCTCGCACG TCGAGCCCTT CGACCTCGGC AACTACGCCA AGCCCGACTA CTACTGGGGC 
TACCAGTCGA AGGCCTTCAA CGCGCTGTTC GACAAGATCA AGGCGACGGC CAATGCGGCC 
GAGCGCAACA AGCTGCTCGG CGAAGCGCAG AAGATGCTGG CGGTCGATGC GGCCAACGGC 
TTCCTCTACC AGCCGCAGTT CCCCACCATC GCGAAGAAGA ACGTGAAGGG CCTCTGGAAG 
GAGAACCCGA TCTTCGTGAA CGACCTCTCG GCGCTGTCAT GGGGATGA

Protein sequence

MLNRRTLLAT AGATVALASP IAGMAQGRKD AIVIGMALEP PGLDPTAGAA AAIAEVVHYN 
ILETLTKINA DGSVTPLLAE SWEISPDLKT YTFKLRRGVK YQNGEPFNAA AVKFSFDRAG 
GEKSTNKDKR TFANLSTQVV DDYTVVVINK EIDPDLPFVL GQATAVIVEP KSADGNATKP 
VGTGPYKLDN WAKGSSITLS KWEGFRSPAT ARINKVTFRF ISDTAAQAAA LMAGDVDVFT 
RIGTRAVPQF KMNPQFQVIL AGSRAKTILS INNKKKPLDD VRVRRAILAA IDRKAVIEGA 
ADGFGVPIGS HYVPGAAGYV DTTGINPFDL EKAKKLMAEA GVKTPLELTM TLPPPPYARQ 
GGEVIVAQLA KIGITVKVQN VEWAQWLSGT YGNKDYDLSI VSHVEPFDLG NYAKPDYYWG 
YQSKAFNALF DKIKATANAA ERNKLLGEAQ KMLAVDAANG FLYQPQFPTI AKKNVKGLWK 
ENPIFVNDLS ALSWG