Gene Vapar_0399 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_0399
Symbol
ID	7973543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	431143
End bp	432783
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	63%
IMG OID	644791002
Product	extracellular solute-binding protein family 5
Protein accession	YP_002942328
Protein GI	239813418
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGA CCACCCAGCC ATCCGTTTCG CGCCGCTCGC CCAGGCTTGG CGCGCTGCTC 
GCGCCGGCGG CACTCGCCAT GCTCGCACTG GGCGCGGGCG CCGTGTCCGC CAAGACGCTG 
GTCTATTGCT CGGAGGGCAG TCCCGAGAAC TTCTATCCGG GCGTCAACAC CACCGGCACC 
TCGTTCGACG TGACCACGCA GGTCTACAAC ACCATTGTCG AGTTCGAGCG CGGCGGCACC 
AAGGTCGTGC CGGGCCTGGC TGAAAAATGG GACATCTCCG CCGATGGCAC GGTCTACACC 
TTCCACCTGC GCAAGGGCGT CAAGTGGCAC AGCACCAGCA AGAGCTTCAA GCCCACGCGC 
GACTTCAACG CCGACGACTT CATCTTCATG CTCGAGCGGC AGTGGAAGGA GAGCGATCCC 
TTCTTCAAGG TCACGAGCCA GAACCACTCC TACTTCAACG ACATGGGCAT GCCCAAGCTC 
CTGAAGTCGG TGGACCGCAT CGACGACCTG ACCGTGAAGA TCACGCTCAA CCAGGCCGAG 
GCGCCGTTCC TTGCCAACCT GGCCATGCAG TACGCGGGCA TCCAGTCGAA GGAATACGCC 
ATTGCGATGC TGAAGGCCGG CACGCCCGAG AAGGTCGACC AGGACCCGAT CGGCACCGGC 
CCGTTCTACC TCGTGCAATA CCAGAAGGAC GCGGTCATCC GCTTCAAGGC CTTCCCGCAG 
TACTGGGGCG GCAAGGCGAA GATCGACGAC CTCGTGTTCG CGATCACGCC CGATGCCTCG 
GTGCGCTGGG CCAAGCTGCA GAAGGGCGAA TGCCACGTCA TGCCGTATCC GAATCCGGCC 
GATCTCGACG CGATCCGCAA GGACCCGAAC GTGCAGGTGC TCGAGCAGCC TGGCCTCAAC 
GTGGGCTACC TTTCGTACAA CACCACCAAG AAGCCCTTCG ACGACGTGCG CGTGCGCAAG 
GCCATCAACA TGGCGATCAA CAAGAAGGCG ATCATCGACG GCGTGTACCT GTCGACCGGC 
GTGGCCGCGA AGAACCCGAT CCCGCCCACC ATGTGGTCCT ACAACGACGC GGTCAAGGAC 
GATCCCTACG ACCCCGAAGC CGCCAAGAAG CTGCTGGCGC AGGCCGGCTT TCCCGATGGC 
TTCTCGACCG ACCTGTGGGC CATGCCGGTG CAGCGGCCCT ACAACCCGAA TGCCAAGCGC 
ATCGCCGAGC TGATGCAGGC CGACCTTGCC AAGATCAACG TCAAGGCCGA GATCAAGAGC 
TTCGAGTGGG GCGAGTACCG CAAGCGCCTG CAGGCCGGCG AGCACCAGAT GGGCATGCTC 
GGCTGGACCG GCGACAACGG CGACCCCGAC AACTTCCTCT ACACGCTGCT GGGCTGCGCC 
TCGGCCAAGT CGGCCAGCGG CAGCAACATC TCCAAATTCT GCTACCAACC CTACGAAGAC 
CTCGTGCTCA AGGCCAAGAG CGCGACCAAG CAGGCCGAGC GCGATGCGCT CTACAAGAAG 
GCGCAAGTCA TCTTCAAGGA GCAGGCGCCG TGGTTCACCA TCGCGCACGC GGTGCAGCTG 
AAGCCGGTGC GCAAGGAGGT GGTCGACTTC AAGCTCAGCC CCTTCGGCCG CCACACCTTC 
TACGGCGTGG ACATCAAGTA G

Protein sequence

MKKTTQPSVS RRSPRLGALL APAALAMLAL GAGAVSAKTL VYCSEGSPEN FYPGVNTTGT 
SFDVTTQVYN TIVEFERGGT KVVPGLAEKW DISADGTVYT FHLRKGVKWH STSKSFKPTR 
DFNADDFIFM LERQWKESDP FFKVTSQNHS YFNDMGMPKL LKSVDRIDDL TVKITLNQAE 
APFLANLAMQ YAGIQSKEYA IAMLKAGTPE KVDQDPIGTG PFYLVQYQKD AVIRFKAFPQ 
YWGGKAKIDD LVFAITPDAS VRWAKLQKGE CHVMPYPNPA DLDAIRKDPN VQVLEQPGLN 
VGYLSYNTTK KPFDDVRVRK AINMAINKKA IIDGVYLSTG VAAKNPIPPT MWSYNDAVKD 
DPYDPEAAKK LLAQAGFPDG FSTDLWAMPV QRPYNPNAKR IAELMQADLA KINVKAEIKS 
FEWGEYRKRL QAGEHQMGML GWTGDNGDPD NFLYTLLGCA SAKSASGSNI SKFCYQPYED 
LVLKAKSATK QAERDALYKK AQVIFKEQAP WFTIAHAVQL KPVRKEVVDF KLSPFGRHTF 
YGVDIK