Gene RSP_3525 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3525
Symbol
ID	3721940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007494
Strand	-
Start bp	604763
End bp	606370
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	66%
IMG OID	640073190
Product	ABC peptide transporter, periplasmic binding protein
Protein accession	YP_355028
Protein GI	77465525
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAT CGCACCACCT GCTGATGGAC GATCTGGTCA CGCGGCTGCG GCGCGGACAG 
CTGTCGCGTC GCGAGTTTCT GGCCCGCAGT TCGGCGCTGC TGGCGGCCGG CGCCATGAGC 
GGCCTGCCCG GTGCGGCGCT TGCCCAGCAG GCGGCACCGA AGGCCGGCGG CTTCATGCGG 
CTCGGCCTGC ACAATGCCTC GCAGAACGAC AACCTCGATC CCGGCAGCTG GTCGACGAGT 
TGGACCGGCG CCTCGTTCAA CGGCGGCGTC TACAACAACC TCGTCGAGAT CCTGCCCGAC 
GGCTCGGTCG CGGGCGATCT GGCCGAGAGC TGGGAGGCGG AGCCCGGCGC GAAGGTCTGG 
CGCTTCAAGC TGCGCTCGGG CGTGACCTTC CACAACGGCA AGAGCCTCGA GGCGGAAGAC 
GTGCGCCAGT CGCTCGAGCA TCACATGAAG CCGGACTCGA CCTCGGGCGC GCGCGCCATC 
GTCGAGCAGA TCGAGACCAT CGACATCGAA GGGTCCGACA CCGTCCGCAT CACCCTCTCG 
GAGGGCAATG CCGACCTGCC CTACCTCCTG TCGGATTATC ACCTCTCGAT CTATCCGGCG 
CTGGAGGGCG GCGGGATCGA CATGGAGAGC GCCAACGGCA CCGGCGCCTT CCTCCTCGAG 
AGCTTCGAGC CGGGCATCGC CACCCGCCTC AAGCGGAACC CGAACTACCA CAAGAACAAC 
AAGCCCTATC TCGACGAGGT CGAGTTCATC AACATCACCG ACGCCACGGC GCGGCTGAAC 
GCGCTGCTGA CCGGCGAGGT CGATTTCATC CAGGATCTCG ACATCCGCAA CGTGGCGATG 
GTCGAGCGCA GCGGCGATTT CTCGGTTCAG CGCGTGCCGA GCCTGCGCCA CTTCACCTTC 
GACATGGACA CCCGCGTCGC GCCCTTCGAC AATCCCGATG TGCGGCTGGC GCTGAAATAT 
GCGCTCGACC GGGATGACGT GATCGAGAAG GTGTTCCTTG GCGAGGCCAC GAAGGGGAAC 
GACAACCCGG TCGCCTCGAT CCAGAAATTC TACCACGACA TGCCCGCGCG CGAATACAGC 
ATCGCGAAGG CCAAGGAGCA TCTGGCCAAG GCCGGGCTCG ATCAGGTGAG CGTCGATCTG 
TCGGTGGCCG AGAATGCGTT TGCGGGCGCC ATCGAGGCGG CGACGCTCTA CCAGCGCCAT 
GCGGCCGAGG CCGGCATCAA CATCAACATC GTGCAGGAGG CGGCCGACGG CTACTGGGAG 
AACGTCTGGC GCAAGAAGCC CTTCTGCGCG GTCGACTACT TCGGCCGCGC CACCGTCGAC 
TGGCTGTTCT CGACGAGCTA TGTCACCGGC GCGCCGTGGA ATTCGGGCTG GTCGAACGCG 
CGGTTCGACG AGCTGCACCA GACGGCGCGG GCCGAGACCG ACGAGGCCAA GCGCGCCGCC 
TGCTACGCCG AAATGCAGGA GATCCTGCGC GACGACGGCA ACGTCATCAC CGTGGCCTTC 
GTGAGCTGGC GCAACGCCGT CTCGAACCGC ATCGGCTTCG GCGAGGTCGG CGGGCTGATG 
CCGCTCGACA ACATGCGGAT GTGCGAGCGC TGGTGGGTCA AGGACTGA

Protein sequence

MNKSHHLLMD DLVTRLRRGQ LSRREFLARS SALLAAGAMS GLPGAALAQQ AAPKAGGFMR 
LGLHNASQND NLDPGSWSTS WTGASFNGGV YNNLVEILPD GSVAGDLAES WEAEPGAKVW 
RFKLRSGVTF HNGKSLEAED VRQSLEHHMK PDSTSGARAI VEQIETIDIE GSDTVRITLS 
EGNADLPYLL SDYHLSIYPA LEGGGIDMES ANGTGAFLLE SFEPGIATRL KRNPNYHKNN 
KPYLDEVEFI NITDATARLN ALLTGEVDFI QDLDIRNVAM VERSGDFSVQ RVPSLRHFTF 
DMDTRVAPFD NPDVRLALKY ALDRDDVIEK VFLGEATKGN DNPVASIQKF YHDMPAREYS 
IAKAKEHLAK AGLDQVSVDL SVAENAFAGA IEAATLYQRH AAEAGININI VQEAADGYWE 
NVWRKKPFCA VDYFGRATVD WLFSTSYVTG APWNSGWSNA RFDELHQTAR AETDEAKRAA 
CYAEMQEILR DDGNVITVAF VSWRNAVSNR IGFGEVGGLM PLDNMRMCER WWVKD