Gene Rsph17025_2830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2830
Symbol
ID	5085108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	2880249
End bp	2881376
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	70%
IMG OID	640484400
Product	ABC transporter related
Protein accession	YP_001169021
Protein GI	146278862
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.461635
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.240559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACC AGTCCGTTCC CACCTTCGAG GACGAGGACA AGGACGAGGT CGCCACCCGC 
CCCGGTCTGG AGATCCGCGG CCTCTACAAG ATCTTTGGCC CCAGCCCGTC GCGCTGGATC 
GGCGCGGTGA AGGCCGGGAT GACCAAGACC GACCTCAACC GCCGCCACGG CCATGTGCTG 
GGCCTGACCG ACATATCGCT GTCGATCCCG CCGGGGCGGA TCACCGTCAT CATGGGCCTG 
TCCGGGTCGG GCAAGTCCAC GCTGATCCGC CACATCAACG GGCTGATCGC TCCCACGGCG 
GGCGAGATCC TGTTTGACGG CACCGATGTC TGCCGCATGA GCGCGGCCGA GCTGCGCGGC 
TTCCGCCGCA GCCGCACCGC GATGGTGTTC CAGAAGTTCG CGCTCCTGCC GCATCGCACG 
GTGCTGGAGA ACACGCGCTA CGGGCTCGAC ATCCGCGGCG TTCCGCGCGC CGAGGCCGAG 
AGGGCAGCGC GGCGCTGGAT CGCGCGCGTG GGCCTCGGTG GCTACGAGAA CAGCTATCCG 
TCGCAGCTTT CGGGCGGGAT GCAGCAGCGC GTGGGGCTGG CGCGGGCGCT GGCCACCGAC 
GCCGAGATCC TGCTGATGGA CGAAGCCTTT TCCGCGCTCG ATCCGCTGAT CCGGCTGGAC 
ATGCAGAGGA TCCTGCTGGA GCTGCAGGAG GAGCTGCACC GCACCATCGT CTTCATCACC 
CACGACCTCG ACGAGGCGCT GCGGCTGGGC GACCGGATCG CGATCCTGCG CGACGGCCGG 
CTGGAGCAGG TGGGCACCGG GCAGGACATC GTGCTGCGGC CCGCGAACGA CTACATCGCC 
GCCTTCGTCC ACGAGGTGAA CCGCGCCCGC GTGATCCGTC TCTCGGCCGT GGCGACGCCG 
CTGGTTGAGA CCGACGAGGC GCCGCGCCTG GCCCTGCCGG ACCGGCTCGT GCTCGAGGAG 
GCCGCGCGCG AGATGCTCGC CGCCGGGGCC GAGCGCGCCC TTGTGGTCGG CCCGCGCCGC 
AGGCCGCTGG GGATCGTGCG GATCGGCGAC CTGCTGGCGG GCATGGTCCG CCCGTCCGGC 
CATCCCCCGA CGGATCAAGC CCCGACCAAC CAGAGGAGGA AGCAATGA

Protein sequence

MTDQSVPTFE DEDKDEVATR PGLEIRGLYK IFGPSPSRWI GAVKAGMTKT DLNRRHGHVL 
GLTDISLSIP PGRITVIMGL SGSGKSTLIR HINGLIAPTA GEILFDGTDV CRMSAAELRG 
FRRSRTAMVF QKFALLPHRT VLENTRYGLD IRGVPRAEAE RAARRWIARV GLGGYENSYP 
SQLSGGMQQR VGLARALATD AEILLMDEAF SALDPLIRLD MQRILLELQE ELHRTIVFIT 
HDLDEALRLG DRIAILRDGR LEQVGTGQDI VLRPANDYIA AFVHEVNRAR VIRLSAVATP 
LVETDEAPRL ALPDRLVLEE AAREMLAAGA ERALVVGPRR RPLGIVRIGD LLAGMVRPSG 
HPPTDQAPTN QRRKQ