Gene Vapar_3874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_3874
Symbol
ID	7969731
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	4103872
End bp	4104852
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	72%
IMG OID	644794460
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_002945754
Protein GI	239816844
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGACC TGCTGTTCTC CAAGGCCTCG CGCCGCCATT GGCTCAAGCA GGGCGCGGCG 
CTCTCGTTCG CAGCCACCGC GCCGCTGGGC GCATGGGCGC AAGCGCAAAC CACGCTGGTG 
CTCGGCGACC AGGCCGGCGG CCTGCGCGCG CTGTTCGAGG CCTCGAAGGC GCTCGAGGGC 
GTGCCCTTCG CCTACCGCTG GGCCAACTTC CAGGGCGCGG CGCCGCTGTT CGAGGCGCAG 
CGCAGCGCGG CCGTCGACAC CGCGGTGGCC GGCGACCTGC CGGTGCTGGC GGCGGCGGTC 
GGCCGGACGC CGCTGAAGAT CGTCGCCACG CGCGTCGGCA AGGCCGATGC GCTGGGCATC 
GTGGTGCAGC CCGATTCGCC GTTGCGCCAG GTGGCCGACC TGCGCGGCAA GACGGTGATC 
GTGTCGTCCG CGCGCGGCAG CATCTCGCAA TACCAGCTCT ACGGCGCGCT CGAGGAAGCC 
GGCGTGCGGC GCGACGAGGT CACGGTGAAG TTCGTGCTGC CGACCGATGC GGCCGCGGCC 
TTTGCCTCGA AGCAGATCGA TGCCTGGGCT GTGTTCGATC CCTACTACAC GATCGCGCTG 
CAGCAGGGCG GGCGCATCCT GCGCGATGGG CGCGGCATCA ACACGGCGCT GGGCTTCATC 
ACCGCGAGCG AGCCGTCGCT CGCCGACCCC GCCAAGCGCG CCGCCATCGT GCAGTTTCTG 
GACCGGCTGG CGCGCGCGGG CGAATGGGCG CTGGCCACCC CCGAGGCCTA TGCGCAGGCC 
TACAGCCAGC TCACGCGCCT GCCGATCGAA TCGGCCCGCA TCATCACGGC GCGCGCCTCG 
GTCACGGGCC GGCCAGTGTC CGAAGCCGAC ATTGCCGCGC TGCAGACGGT GGCCGACCGC 
TCGGCGCGCG ACGGCATCCT GCCGCTGCGC GTTGACGTGC GCGCCATCAC CGATGCGCAG 
CTGTGGAAGC GTCCCGCGTG A

Protein sequence

MTDLLFSKAS RRHWLKQGAA LSFAATAPLG AWAQAQTTLV LGDQAGGLRA LFEASKALEG 
VPFAYRWANF QGAAPLFEAQ RSAAVDTAVA GDLPVLAAAV GRTPLKIVAT RVGKADALGI 
VVQPDSPLRQ VADLRGKTVI VSSARGSISQ YQLYGALEEA GVRRDEVTVK FVLPTDAAAA 
FASKQIDAWA VFDPYYTIAL QQGGRILRDG RGINTALGFI TASEPSLADP AKRAAIVQFL 
DRLARAGEWA LATPEAYAQA YSQLTRLPIE SARIITARAS VTGRPVSEAD IAALQTVADR 
SARDGILPLR VDVRAITDAQ LWKRPA