Gene RSP_1451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_1451
Symbol
ID	3718784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	+
Start bp	33636
End bp	35210
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	65%
IMG OID	640069598
Product	ABC peptide/nickel/opine transporter, periplasmic substrate-binding protein
Protein accession	YP_351493
Protein GI	77461989
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.482227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACAGAC GGAGTTTCCT TCGATACGGC GCACTGGCGG GCACGGCCCT CGGCGCGGCG 
CGCATCAACC CCGACTTCTT CTTCAGCTCC GCCTTCGCGC AGGAGTCCCG CCCGCTGGTG 
TTCCTCTCGG CCGAGAACAT CACCGGCAAC TGGGACCCGA CCGCGCATAC GACGCTGTCG 
CAGACCAATA TCGAGGGCTT CGTCATGGGT TATCTGACCC GGGCCCCGAT GCGCCCGGAA 
GAGCCCGACA AGGTGGTCTA TGAACTTGCG ACCGAGATCA CCGAGCTCGA CGCCCACCGG 
CTGCAGATCA AGCTGCGCGA CGGTGTCACC TTCCATGACG GCAAGCCCTT CACCGCCGAG 
GATGTGAAGG CGACCTTCGA ATACGGCGCC AAGCTCGACC GCCCGAAACA GGTCTATCCG 
GGCGGCCCGG AGACCTTCTC CGTCGAGACG CCCGACGATC ATACCGTGAT CGTCGACACG 
TCGAAGGGCG GCTACGGCGC CTCGCTCTTC ATCTTCCTGG CCTCCTATCT GCCGATCCTG 
TCGGCCAAGG ACGTGGCCGA AGGCCCGAAG GGCCCGCTGT CGCAGCGGCT GAACGGCACC 
GGCCCGTTCC GCTTCGTCGA ACAGCGCGGC AACGACACGG TGATGGAAGC CTACGACGGC 
TATTTCCGCG GCGCGCCGAA GGTCACCGGC GTCACCTTCT CGTTCGTGGG CGATGCGACG 
ACGCGGATGC TGTCCCTGAT GAACGGGCAG GCCGATGTCA TCGAACGGCT GGAGCCTGAG 
CAGGTCGAAA CCCTGCAGGC GCGCGACGAC ATCAAGATCT CGCGGCTGGT CTCGGTCGAG 
AACAAGTATC TGTGGTTCCG CTGCTCGAAG CCGCCCTTCG ACGACTGGCG CGTGCGCAAG 
GCCGCCTGCC ATGCCATCGA TCGCAGCATG ATCATGGAGA TCATGGGGTC GGCGGGCGAG 
GCCTCGTCGA ACTTCGTCTC GCCGATCAAG TTCGGCTATA TCGATCTGGA GAACTACCCC 
GAATACAATC CCGAGGAATG CCAGCGCCTG CTGGCCGAAG CGGGCTACCC GAACGGCGAG 
GGCCTGCCCG AGCTGGAATA TATCACCTCG ACCGGCTTCT ATCCCAAGAC CAAGGAATAT 
GGCGAGCTGA TCGCGGCGCT TCTGCAGGAG CAGGGCTTCC CGGTCACGCT GAACGTGATG 
GAGGTCGCGG CCTGGAACGA GCGGCTCTAC GACCGGCCGG GCGGCGGCCC GGGCCATATG 
GTCGATTGCG GCTGGTCCAC CGGGTCTCCC GAGCCCGATC TGGTCCTGCG CACCCACTTC 
CACTCCACCG CCAAGCGGAT CTGCGGCATC GTCGATCCCG AGATCGACGC CGCCCTCGAT 
GCGGAGCGTG ACGCGCCCTC GCTCGAGGCG CGCAAGGAGA GCCTGCAGAC CAACCTGATG 
CCGATGCTGG CCGACAAGGC GCCGGCGCTG AGCCTCTTCA CCTCGGTCCT GATCCACGGG 
ATGCGAGCCA ATGTGGAGGG ACTGTTCATC TACCCGGATG GCCAGTCGGA CGCCTCGCAG 
ACCACGCTCG GCTGA

Protein sequence

MDRRSFLRYG ALAGTALGAA RINPDFFFSS AFAQESRPLV FLSAENITGN WDPTAHTTLS 
QTNIEGFVMG YLTRAPMRPE EPDKVVYELA TEITELDAHR LQIKLRDGVT FHDGKPFTAE 
DVKATFEYGA KLDRPKQVYP GGPETFSVET PDDHTVIVDT SKGGYGASLF IFLASYLPIL 
SAKDVAEGPK GPLSQRLNGT GPFRFVEQRG NDTVMEAYDG YFRGAPKVTG VTFSFVGDAT 
TRMLSLMNGQ ADVIERLEPE QVETLQARDD IKISRLVSVE NKYLWFRCSK PPFDDWRVRK 
AACHAIDRSM IMEIMGSAGE ASSNFVSPIK FGYIDLENYP EYNPEECQRL LAEAGYPNGE 
GLPELEYITS TGFYPKTKEY GELIAALLQE QGFPVTLNVM EVAAWNERLY DRPGGGPGHM 
VDCGWSTGSP EPDLVLRTHF HSTAKRICGI VDPEIDAALD AERDAPSLEA RKESLQTNLM 
PMLADKAPAL SLFTSVLIHG MRANVEGLFI YPDGQSDASQ TTLG