Gene RPD_0115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0115
Symbol
ID	4020571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	128620
End bp	129606
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	65%
IMG OID	637960292
Product	ABC transporter, substrate-binding protein, aliphatic sulphonates
Protein accession	YP_567256
Protein GI	91974597
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.991586
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAACA TCTCACGGCG CGCCATCACG GCGCTGATCG CCGCCGCCGC GTTTCTGCCG 
GGCGTCCTGC CTGTCGTGGC GTCGGCGGCC GACAAGCCGA AGGAAATCCG GATCGATTGG 
GCGACCTATA ATCCGGTCTC GATCGTTCTG AAGCAGCAGG GCCTGCTTGA AAAGGAATTC 
GCCAAGGACG GCATCAGCGT CGTCTGGGTG CAGTCGGCCG GCTCCAACAA GGCGCTGGAA 
TTCCTCAATG CCGGCTCGAT CGATTTCGGC TCCACCGCCG GTTCGGCGGC TCTGGTCGCC 
CGGATCAACG GCAATCCGAT CAAGTCGGTC TATGTCTATT CGCGGCCGGA ATGGACCGCG 
CTGGTGACGG CCAAGGATTC CAAGATCGCC TCGGTCGCCG ACCTCAAGGG CAAGCGCGTC 
GCGGTGACGC GCGGCACCGA TCCGCACATC TTCCTGGTGC GCGCGCTGCT CGACGCCGGG 
CTCAGCCAGA ACGACATCAC GCCGGTGCTG TTGCAGCACG CCGACGGCAA GGCCGCGCTG 
ATCCGCGGCG ACGTCGACGC CTGGGCCGGT CTCGATCCGA TGATGGCGCA GGCCGAAGTC 
GAGGAGGGCG CGAAGCTGTT CTTCCGCAAG CCTGAAGCCA ACACTTGGGG TATCCTCAAT 
GTCCGGGAGC AGTTCCTCAA GGACAATCCC GATCTGGTCC GCCGCGTGCT CGCGGTCTAC 
GAGGACGCGC GCAAGTACGC GGTGGCCAAC ACTGACGAGG TGAAGAAGGC GTTCATCGGC 
GTCACCAAGC TGCCGGAAAC AGTGGTCGAC AAGCAGCTCA AGGAACGCAC CGAGTTGACG 
CATAGCCGGA TCGGCGCGCC GCAGCGCGAC TCGATCCTGG CCGCGGGCCT GGCGCTGCAG 
CAGGCCGGGG TGATTCAGTC GTCGGTCGAT GTGAAGGCGA CGCTCGATCA ACTGATCGAC 
GACCAGGTCC CGCTGCCGAC CAACTAA

Protein sequence

MSNISRRAIT ALIAAAAFLP GVLPVVASAA DKPKEIRIDW ATYNPVSIVL KQQGLLEKEF 
AKDGISVVWV QSAGSNKALE FLNAGSIDFG STAGSAALVA RINGNPIKSV YVYSRPEWTA 
LVTAKDSKIA SVADLKGKRV AVTRGTDPHI FLVRALLDAG LSQNDITPVL LQHADGKAAL 
IRGDVDAWAG LDPMMAQAEV EEGAKLFFRK PEANTWGILN VREQFLKDNP DLVRRVLAVY 
EDARKYAVAN TDEVKKAFIG VTKLPETVVD KQLKERTELT HSRIGAPQRD SILAAGLALQ 
QAGVIQSSVD VKATLDQLID DQVPLPTN