Gene Vapar_3872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_3872
Symbol
ID	7969729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	-
Start bp	4101541
End bp	4102530
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	70%
IMG OID	644794458
Product	extracellular solute-binding protein family 3
Protein accession	YP_002945752
Protein GI	239816842
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACATCTG ACTTCCCCAT CGACAGGCGA CGCCTGCTCC AGGCCGCCGC GGGCTGGAGC 
GCCCTGGGCG CGGTGGGCGC GGCACCGGCG CGCGACCTTT CTGGCGTGAC ACTGCGCGTG 
GGCACCTACA AGGGGCTCTG GCGGCCGCTG CTGCAGGCCT CCGGCCAAGC CAATACGCCC 
TACAAGATCG ACTGGCGCGA GCTCAACAAC GGCGTGCTGC ACATCGAGGC CATCAACGGC 
GATGCGCTCG ACCTGGGCTC GGGCAGCGAG ATCCCGCCGG TGTTCGCGGC GCGCCAGAAA 
TCCAGCGTGC GGCTGGTGGC CGTGACGCAT GAAGACCTCA ACAACCAGGC CACGCTGGCG 
CGCAAGGATT CGCCGATCCG CCGCATCGCC GACTTCAAGG GCAAGCGCGT GGGCTACGTG 
CGCGCCACCA CCTCGCACTA CTACCTGGCC AGGCAGCTGG CCGAGGCGGG GCTTTCGTTC 
AGCGACATCC AGGCCGTGAG CCTCACGCCT TCGGACGGCC TCTCGGCCTT CGCGCGCGGC 
GACCTCGATG CCTGGGCCAT CTACGGCTAC AACGGCCAGC TGGCGCGCAC GCAGTACGGC 
GCGCGCACCA TCAAGACCGG GGTGGGCTAC CTCTCGGGCA ACTTCCCGAT CTACGCCAAC 
CCGCGTGCGC TCGACGACGA ACTGCGCCGC GCGGCGCTGG GCGACCTGCT GCAGCGCCTG 
CAGCGCGCCT TCGCATGGAT CAACGGCAAC TTCCTGGCCT ATGCGCGTGC GCAGTCGGCC 
GAGACGCGCG TGCCGGTCGG CGACCTGGTC GAACTCTTCA ACGGCCGCAG CGGCGACTAC 
AGCCTGGGCC CGGTTACCGA TGCGGTGGTG CGCAGCCACC AGGAGGTGGC CGACACCTTC 
CTGAAGATCG GCGTGCTCGA TGGGCCCGCC GACGTGAAGC CCCTGTGGGA CCGCCGCTTC 
GAGAGCCTGC TGCGCCTGCC CGCCGCCTGA

Protein sequence

MTSDFPIDRR RLLQAAAGWS ALGAVGAAPA RDLSGVTLRV GTYKGLWRPL LQASGQANTP 
YKIDWRELNN GVLHIEAING DALDLGSGSE IPPVFAARQK SSVRLVAVTH EDLNNQATLA 
RKDSPIRRIA DFKGKRVGYV RATTSHYYLA RQLAEAGLSF SDIQAVSLTP SDGLSAFARG 
DLDAWAIYGY NGQLARTQYG ARTIKTGVGY LSGNFPIYAN PRALDDELRR AALGDLLQRL 
QRAFAWINGN FLAYARAQSA ETRVPVGDLV ELFNGRSGDY SLGPVTDAVV RSHQEVADTF 
LKIGVLDGPA DVKPLWDRRF ESLLRLPAA