Gene Rsph17025_2828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2828
Symbol
ID	5085106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	2878268
End bp	2879269
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	70%
IMG OID	640484398
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_001169019
Protein GI	146278860
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.23634
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAGC GCATCGCTTC CGCCTGGCTT GCCGCGTCGC TTGCTGCCCT CGCCGCTCCG 
GCTTGGGCGC AGGAGACGTG CGGCCGGATC AGCATCGCCG AGATGAACTG GGCCTCGGCC 
GGGGTGGCGG CGCAGGTGGA CCGGATCATC CTCGAGGAAG CCTTCGGCTG CGACGTGGAG 
CTGGTCACCG GCGACACGAT GCCGACCTTC ACCTCGATGA ACGAGAAGGG CGAGCCGGAC 
ATGGCGCCCG AGATGTGGGT GAACGCGGTC CGCGCCCCGC TCGACGCCGC CGTGGAGGAG 
GGCCGGCTGG TGATCGCGGC GCCCATCCTC GAGGAGGGCG GCATCGAGGG CTGGTGGATC 
CCGCGCTATC TGGCCGAGGC CCATCCCGAG ATCGACAGCG TCAAGGCGGC GCTCGCCCGT 
CCCGAACTGT TTCCCGCGCC CGAGGATCCC TCGGTCGGCG CCGTCCACAA CTGCCCGCCC 
GGCTGGAACT GCCAGATCTC GACCGAGAAC CTCTTCCGGG CGCTCGATGC CGAGAGCCGC 
GGCTTCACGC TCGTTGATAC CGGCTCTTCG GCGGGGCTCG ACGGCTCGAT CGCCAATGCC 
TACGAGCGCA GGGCCGGCTG GTTCGGCTAC TACTGGGCGC CGACGGCGAT CCTCGGCAAG 
TATGACATGG TGCGCCTGCC GTTTTCGGTG CCCCACGACA AGGCCGAATG GGACAGCTGC 
ACCGCGGTGC CCGACTGCGC CGAGCCCAGT GTGAATGCCT ATCCGGTGTC CGAGGTCTTT 
ACCGTCGTCA CCCCCGCCTT TGCCGAGAAG GCCGGCGTGG CCATGGACTA TGTCGGCGCG 
CGCCGATGGA GCAACGGCAC CGTGGGCGCG GTGCTGGCCT GGATGGACGA GAACCAGGCC 
ACGAACGAGG AGGCGGCGCG TCACTTCCTC GAAACCTACC CCGAGTTGTG GCGTGCCTGG 
CTTCCGGCCG AGGCCGCCGA CCGGGTCGCC GCGGCGCTCT GA

Protein sequence

MTKRIASAWL AASLAALAAP AWAQETCGRI SIAEMNWASA GVAAQVDRII LEEAFGCDVE 
LVTGDTMPTF TSMNEKGEPD MAPEMWVNAV RAPLDAAVEE GRLVIAAPIL EEGGIEGWWI 
PRYLAEAHPE IDSVKAALAR PELFPAPEDP SVGAVHNCPP GWNCQISTEN LFRALDAESR 
GFTLVDTGSS AGLDGSIANA YERRAGWFGY YWAPTAILGK YDMVRLPFSV PHDKAEWDSC 
TAVPDCAEPS VNAYPVSEVF TVVTPAFAEK AGVAMDYVGA RRWSNGTVGA VLAWMDENQA 
TNEEAARHFL ETYPELWRAW LPAEAADRVA AAL