Gene Vapar_2981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_2981
Symbol
ID	7972257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	-
Start bp	3137555
End bp	3138592
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	65%
IMG OID	644793566
Product	sulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_002944867
Protein GI	239815957
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTTC GCCGCGACTT TATCAAGCTT TCCCTGGGTG CCGGCGTGGC CGGTGCCATG 
GCCCTGACGG CATTGCCGTC GTTCGCGCAG GGCGCGGCCC CCGTGACGCT GCTCAACGTG 
TCGTACGACC CGACGCGCGA GCTGTACGTC GACTACAACC GCGCCTTCGC CAAATACTGG 
AAGGGCAAGA CCGGCCAGGA CGTGACCATC AAGCAGTCGC ACGGCGGCTC GGGCAAGCAG 
GCCCGCTCGA TCATCGACGG CATCGATGCC GACGTTGCCA CTCTGGCGCT GGGCGGCGAC 
ATCGACGCGC TCGCCACGCA CGGCGGCCTC GTCAAGGCCG ACTGGCAAAA GCGCCTGCCG 
CAGAACTCGG CGCCCTACAC CTCGACCATC GTGTTCCTTG TGAAGAAGGG CAATCCCAAG 
GGCCTGAAGG ACTGGGACGA CCTCGTGAAA CCCGGCGTGC AGGTGATCAC GCCCAACCCC 
AAGACCTCCG GCGGCGCGCG CTGGAACTAC CTGGCTGCCT GGGAATTCGC CAAGCGCAAG 
TACGGCAGCG ACGCCAAGGC CAAGGAATAC ATCGGCAGCC TGTTCAAGAA CGTTCCGGTG 
CTCGATGCCG GCGCGCGTGG CGCCACCATC ACCTTCGTGC AGCGCGGCGT GGGCGACGTG 
CTGCTGGCCT GGGAGAACGA AGCCTTCCTG GCGCTGAAGG AATTCGGCGC CGAGAAGTTC 
GAGATCGTGG TGCCGTCGAT CTCGATCCTG GCCGAGCCCA CCGTGGCGGT GGTCGACAAG 
GTGGTCGACA AGAAGGGCAC CCGCGCGGTG GCCGAGGAAT ACCTCAAGTA CCTGTATTCG 
GACGAAGGCC AGGACATTGC GGGCCGCAAC TTCTATCGCC CGACCTCGGA AAAGGCCAAG 
GCCAAGTACG ACAAGCAGTT TCCCAAGCTC ACGCTGGTGA CCATCGACCA GGCCTTCGGC 
GGCTGGGCCA AGGCCGACAA GGAGCACTTT GCCGACGGCG CTTCGTTCGA CCAGATCTAC 
ACGGCCAAGC AGAAGTAA

Protein sequence

MSLRRDFIKL SLGAGVAGAM ALTALPSFAQ GAAPVTLLNV SYDPTRELYV DYNRAFAKYW 
KGKTGQDVTI KQSHGGSGKQ ARSIIDGIDA DVATLALGGD IDALATHGGL VKADWQKRLP 
QNSAPYTSTI VFLVKKGNPK GLKDWDDLVK PGVQVITPNP KTSGGARWNY LAAWEFAKRK 
YGSDAKAKEY IGSLFKNVPV LDAGARGATI TFVQRGVGDV LLAWENEAFL ALKEFGAEKF 
EIVVPSISIL AEPTVAVVDK VVDKKGTRAV AEEYLKYLYS DEGQDIAGRN FYRPTSEKAK 
AKYDKQFPKL TLVTIDQAFG GWAKADKEHF ADGASFDQIY TAKQK