Gene Vapar_3865 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_3865
Symbol
ID	7969722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	-
Start bp	4094352
End bp	4095317
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	69%
IMG OID	644794451
Product	aliphatic sulfonates family ABC transporter, periplsmic ligand-binding protein
Protein accession	YP_002945745
Protein GI	239816835
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCAC ATCTCAACCG ATCGCGCCGA CAGCTCCTCG CAAGCGGCCT TGCCGCTGCC 
GTGGCCTTGC CTGTTTTCTC ATTGCAGGCC CGCGCACAGG GCCGCCCCGT TCTCAAGGCC 
GGCGACCAGA AGGGCGGGCT GCGCGCGCTG CTCGAAGCGG CCGGCGGACT CGAAGGCCTT 
GGCTATGACA TCCAGTGGTC GGAATTCCCC GCCGCTGCGC CGCTGGCCGA AGCGCTGAAC 
GCCGCGGCGG TCGATTCCGG ACCCATCGGC GATGCGCCGC TCATCTTTGC GCTTGCGGCC 
GGCACGCGCG TCAAGGCCAT CGGCGCGAAC CGTTCGGATT CGTACGGCAC GGCTGTGCTG 
GTGCGGCCCG ATTCGCCGCT CAAGACCGCG GCCGATCTCA AGGGCAAGAG CATCGCGACC 
AACCGCGGCT CCATCGGCCA CTACGTGACG CTCAAGGCCA TCACCGCGGC GGGACTCAAG 
CCCGAGGAGG TCAACATCCG CTTCCTTGCG CCGGCCGACG CCAAGCTCGC GCTCACGCAG 
GGCTCGGTCG ATGCCTGGGC CACCTGGGAG CCCTACACCG CGCTGGCCGA GGTCAGCCGC 
CACGCGCGCG TGCTCGTGAG CGGTCGCGGG CTGCTGCCGG GGCTCAGCTA CCTCGCGGCC 
ACCGATGCCG CCATTGCCGC CAAGCGGCCG GTGCTGCAGG ACTTTCTGCA GCGCGTGGTC 
AAGGCCCAGC TCTGGTCGTA CCGCAACGCC GATGCCTACT CGGCCGCACT GGCCCGCATC 
ATCGGCATTC CGCCCGAAGC GGCCAAGCTG CAGTTCGAGC GGCGCCAGCA GAGGTGGATA 
CCCATCGATG CACAGGTCAT CGCCGACCAG CAGGGCACGG CGGATTTCTA CCGGCAGGTG 
GGGCTCATCA GGCAGCCGCT GGATGTGAAG GGGACGTTCG ACACGGGGTT TGGTGTGGCG 
GGCTGA

Protein sequence

MNPHLNRSRR QLLASGLAAA VALPVFSLQA RAQGRPVLKA GDQKGGLRAL LEAAGGLEGL 
GYDIQWSEFP AAAPLAEALN AAAVDSGPIG DAPLIFALAA GTRVKAIGAN RSDSYGTAVL 
VRPDSPLKTA ADLKGKSIAT NRGSIGHYVT LKAITAAGLK PEEVNIRFLA PADAKLALTQ 
GSVDAWATWE PYTALAEVSR HARVLVSGRG LLPGLSYLAA TDAAIAAKRP VLQDFLQRVV 
KAQLWSYRNA DAYSAALARI IGIPPEAAKL QFERRQQRWI PIDAQVIADQ QGTADFYRQV 
GLIRQPLDVK GTFDTGFGVA G