Gene RSP_3524 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3524
Symbol
ID	3721939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007494
Strand	-
Start bp	603069
End bp	604673
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	68%
IMG OID	640073189
Product	ABC peptide transporter, periplasmic binding protein
Protein accession	YP_355027
Protein GI	77465524
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.413747
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTACC CCACGGGCCC CATCGGCGGG CAGATCCTTG CGCAGGCCAT GAGCCTCGCC 
CCCTCGCGAC GGGCCTTTCT GGGGGGCGCG GCCGCCGTGG CCGGCGCCTT CTGCCTGCCC 
GCCTCGCTGC GAGCCGAGGA AGGGCCGAAG CGGGGCGGCC GGCTCCGCTA CGGCGTCAAC 
GACGGCTCGC AGCAGGATTC GCTCGAGCCC GGCAGCTGGG CCACCGTCAT GTGCGGTGCG 
GCCTTCAACG GCGCGCTCTG CAACAACCTC GTCGAGCTTC TGCCGGACGG GTCGCTGGCG 
GGCGATCTCG CCGAAAGCTG GGAGGAGGCC GAGGGTGCCA CCCGCTGGAC CTTCACGCTC 
CGCAAGGGTG TCCTGTTCCA CGACGGCCGC CCCTTCACCC CGGAGGATGC CCGGCAGTCG 
CTGATGCATC ACATGGGCGA GGGCAGCACC TCGGGCGCGC TCGCCATCGT CAGCCAGATC 
AAGGAGATCG CCGTCGAGGG CGAGGACCGG CTGATCGTGA CCCTCACGCA GGGCAATGCC 
GACTTCCCCT ATCTGCTGTC GGATTATCAC CTCTCGATCT TCCCGGCGAA GGAGGGCGGC 
GGCATCGACT GGGAGAGCGG CATCGGCACC GGCGCCTTCA AGCTCGACAG TTTCGAGCCG 
GGCGTCGCGG TCCGACTGCT CCGCAATCCG AACTATCACA AGCCCGGCCT GCCGCATTTC 
GACGAGGTCG AATTCATCGC GATCCCCGAC CGGTCCGCGC GGCTGAATGC GCTGCTGACC 
GGCGAGGTCG ATGTGATCGA GGATGTCGAC ATCCGCAACG TCCCCCTGAT CGAGCGCAAT 
CCCGATCTGG TGCTGCACCG CACGCCGAGC CTGCGGCACC TGACCTTCGA CATGAACTGC 
CAAACGGCGC CCTTCGACAA TCCGGTCGTG CGCAAGGCCC TGAAGCTCAG CCTCGACCGC 
GAGGATGTGA TCGCCAAGGT GTTCCTCGGC GAGGCCGAGA CGGGGAACGA CAACCCGGTG 
GCGCGCATCA TGCCCTTCTG GGCCGAGACG CCGCCCGAGC ACCGCTACGA TCCCGAGGCC 
GCGCGGGCGC TTCTGGCCGA GGCCGGGATC GAGGGGCTGA CGGTCGATCT CTCGGTGGCC 
GAATCCGCCT TTCCCGGTGC GGTCGAAGCG GGGGTCCTTT TCCGCGAACA TGCCGCCAAG 
GCCGGCATCA CGATCAACCT CGTGCAGGAG GCCGATGACG GCTACTGGGA CAATGTCTGG 
CTGGTGAAGC CCTTCAACGC CGCCGACTGG TACGGGCGGG TCACGCTCGA CTGGCTGTTC 
GCCACCTCCT ACACCTCCGA CGCGCCCTGG AACAACACGG GGTTCAAGAA CGCCCGCTTC 
GACGAGCTGC ATGCGGCGGC GCGGTCGGAG ACCGATCCCG CCACGCGGGG CGAACAGTAT 
GCCGAGATGC AGCAGATCCT GCACGACGAC GGCGGCGTGA TCACGGTGGC CTTCGTGTCC 
TGGCTGCTCG CCATGTCGCG CGCCATCGGC CATGGTGAGA CCGGAGGCAT CCTGCCCGCC 
GACAATCATC GCTGCGCCGA GCGGTGGTGG CGCACCGACG TCTGA

Protein sequence

MRYPTGPIGG QILAQAMSLA PSRRAFLGGA AAVAGAFCLP ASLRAEEGPK RGGRLRYGVN 
DGSQQDSLEP GSWATVMCGA AFNGALCNNL VELLPDGSLA GDLAESWEEA EGATRWTFTL 
RKGVLFHDGR PFTPEDARQS LMHHMGEGST SGALAIVSQI KEIAVEGEDR LIVTLTQGNA 
DFPYLLSDYH LSIFPAKEGG GIDWESGIGT GAFKLDSFEP GVAVRLLRNP NYHKPGLPHF 
DEVEFIAIPD RSARLNALLT GEVDVIEDVD IRNVPLIERN PDLVLHRTPS LRHLTFDMNC 
QTAPFDNPVV RKALKLSLDR EDVIAKVFLG EAETGNDNPV ARIMPFWAET PPEHRYDPEA 
ARALLAEAGI EGLTVDLSVA ESAFPGAVEA GVLFREHAAK AGITINLVQE ADDGYWDNVW 
LVKPFNAADW YGRVTLDWLF ATSYTSDAPW NNTGFKNARF DELHAAARSE TDPATRGEQY 
AEMQQILHDD GGVITVAFVS WLLAMSRAIG HGETGGILPA DNHRCAERWW RTDV