Gene Vapar_5010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_5010
Symbol
ID	7974128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	5323323
End bp	5324654
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	66%
IMG OID	644795604
Product	hypothetical protein
Protein accession	YP_002946879
Protein GI	239817969
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTGA AATCGCTCGC TCTGACCGCC GCCCTGGTGG CCAGCACCCT CGGCGCGCTG 
CTTGCGCCAT CGCTCGCCCA GGCGCAGGCC AAGGAACAGT TCTTTCCGCT GCTGGTGTAC 
CGCACCGGCC CCTATGCGCC CAACGGCACG CCCTGGGCCA ATGGCAAGCA GGACTACATC 
AAGTACATCA ACGCCACCGG CGGCATCAAC GGCGTGAAGA TCACGTACGA AGAGTGCGAG 
ACCGGCTACG CCACCGACAA GGGCGTGGAG TGCTACGAAC GCCTGAAGGG CCGCCCCGGC 
GTGACGCTGT TCGACCCGCA GGCCACCGGC ATCACCTTTG CGCTGACCGA CAAGGTGCCC 
ACCGACAAGA TCCCGCTCAT CACGCTGGGC TACGGGCTGT CGGCGTCGCA GGACGGCAGC 
GTGTTCAAGT GGAACTTCCC GCTGATGGGC AGCTACTGGA CCGCGGCCGA CATCCTGATC 
CAGCACATCG GCAAGAAGGA AGGCGGCATG GACAAGCTCA AGGGCAAGAA GATCGCCCTC 
GTGTACCACG ACTCGCCGTT CGGCAAGGAG CCGATCCCGC TGCTGCAGGA GCGCGCCAAG 
CAGAACGGCT TCGAGCTGTC GCTGATTCCG GTCACCGCAC CCGGCGTGGA GCAGAAGTCC 
GCCTGGCTGC AGGTGCGCCA GTCGCGGCCC GACTACGTGC TCTTGTGGGG CTGGGGCGTG 
ATGAACTCCA CCGCGCTGAA GGAGGCCGTG GCCACCGGCT ACCCACGCGA GAAGATGTAT 
GGCGTGTGGT GGGCCGGCGC CGAGCCTGAC GTGAAGGACG TGGGCGCCAA CGCCAAGGGC 
TACAACGCGC TGGCGCTCAA CACCTCGGGC ACCGAGCCGA AGGTGATCCA GGAAATCCTC 
AAGCAGGTCC ACGACAAGGG CCAGGGCACG GGGCCGAAGG ACGAAGTGGG CTCGGTGCTC 
TACACCCGCG GCGTGATCAT CCAGATGCTG GGCGTCGAAG CCGTGAAGCG CGCGCAGGAG 
CGCTTCGGCA AGGGCAAGGT CATGACCGGC GAGCAGGTGC GCTGGGGCAT GGAGAACCTC 
GCGCTCGACC AGAAGAAGCT CGATTCGCTG GGCTTCTCGG GCGTACTGCG CCCGCTCGGC 
ACCTCGTGCC AGGACCACAT GGGCTCGACC TGGGCCCGCG TGCACACCTG GGACGGCGCC 
AAGTGGGGCG GCATGTCCGA CTGGTACCAG GCCGACGAGC AGATCATCAA GCCGATGGTG 
AAGGTGGCGG CCGAGAAGTA CGCGGGCGAA AAGAAGCTCA CGCGCCGCGA CGCAGCCGAT 
TGCAGCATGT GA

Protein sequence

MKLKSLALTA ALVASTLGAL LAPSLAQAQA KEQFFPLLVY RTGPYAPNGT PWANGKQDYI 
KYINATGGIN GVKITYEECE TGYATDKGVE CYERLKGRPG VTLFDPQATG ITFALTDKVP 
TDKIPLITLG YGLSASQDGS VFKWNFPLMG SYWTAADILI QHIGKKEGGM DKLKGKKIAL 
VYHDSPFGKE PIPLLQERAK QNGFELSLIP VTAPGVEQKS AWLQVRQSRP DYVLLWGWGV 
MNSTALKEAV ATGYPREKMY GVWWAGAEPD VKDVGANAKG YNALALNTSG TEPKVIQEIL 
KQVHDKGQGT GPKDEVGSVL YTRGVIIQML GVEAVKRAQE RFGKGKVMTG EQVRWGMENL 
ALDQKKLDSL GFSGVLRPLG TSCQDHMGST WARVHTWDGA KWGGMSDWYQ ADEQIIKPMV 
KVAAEKYAGE KKLTRRDAAD CSM