Gene RSP_4000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4000
Symbol	proV
ID	3711787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007488
Strand	+
Start bp	48080
End bp	49168
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	67%
IMG OID	640069338
Product	glycine betaine/L-proline ABC transporter ATPase
Protein accession	YP_345205
Protein GI	77404631
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAAAT CCGCAAGAGA GGACGTCATC CGCTGCGAGG GGATCTGGAA GATCTTCGGC 
CGCAGGTCGC GTCAGGCGAT GGAGGCCGTC CGCAGCGGGG GCCTGTCGAA GACCGAGATC 
CGGGAACGGT TCGACTGCGT GGTGGGGGTG CAGGACGCCT CCTTCAGCGT GAAGCGCGGC 
GAGATCTTCT GCATCATGGG CCTGTCCGGC TCGGGCAAGT CGACGCTGAT CCGGCACATC 
AACCGGCTGA TCGAGCCCAC TTCCGGCTCG GTCTTCATCG AGGGGCAGAA CGTCAATGCG 
ATGAACGCCC GCGACCTGCG CGCGCTGCGG GCCCAGCGGA TCGGCATGGT GTTCCAGAGC 
ATGGCGTTGA TGCCGCACCG GACGGTGCGC GACAATGTCG TCTTCTCGCT CGAGGTGCGG 
GGCCGGCCCG AGGAGGAGCG CGCACGGGTT GCGGCGCAGG CCATCGAGGC GGTGGACCTG 
ACGGGATGGG AAACGAAATA TCCCGACGAG CTGTCGGGGG GAATGCAGCA GCGCGTGGGC 
TTGGCCCGTG CCATCGCTGC CGACCCGACC ATCCTGCTGA TGGACGAGCC CTTCTCGGCG 
CTCGACCCGC TGATCCGCAA GCAGCTTCAG ACCACCTTCA TGGCCCTCTC GGCCGAGCTG 
CACAAGACCA CGGTCTTCAT CACCCACGAC CTCGACGAGG CCATCCGCAT CGGTGACCGG 
ATCGCGATCA TGAAGGACGG GGTGCTGGTG CAGATCGGCA CGCCCGAAGA GATCGTGACC 
GAGCCGGCCG ACGAGTATGT GGCCGATTTC GTGGCCGGGA TCTCGAAGCT CGACCTCGTG 
TCGGCGGCGC GCATCATGCA GCCCTTCGAG CAGTATCGCC GGACGCGGCC CACGGACGGG 
ATCGAGGCCT GGCCGGTGGC GCGCCCCGAC GACAAGCTGA ACCGGCTCGT CGATCTGGCG 
GTCGGCACCG ATCATCCGAT CCTCATCAAG GATGCGGACG CCGTGGTGGG TGTCGTGGGA 
AAGCGTGCGC TCCTGCGCGG CATCCAGGGC CGCGAGGACG CGGCCGCTTG CCAGGCGGAG 
GCCGTCTGA

Protein sequence

MTKSAREDVI RCEGIWKIFG RRSRQAMEAV RSGGLSKTEI RERFDCVVGV QDASFSVKRG 
EIFCIMGLSG SGKSTLIRHI NRLIEPTSGS VFIEGQNVNA MNARDLRALR AQRIGMVFQS 
MALMPHRTVR DNVVFSLEVR GRPEEERARV AAQAIEAVDL TGWETKYPDE LSGGMQQRVG 
LARAIAADPT ILLMDEPFSA LDPLIRKQLQ TTFMALSAEL HKTTVFITHD LDEAIRIGDR 
IAIMKDGVLV QIGTPEEIVT EPADEYVADF VAGISKLDLV SAARIMQPFE QYRRTRPTDG 
IEAWPVARPD DKLNRLVDLA VGTDHPILIK DADAVVGVVG KRALLRGIQG REDAAACQAE 
AV