Gene Rsph17029_3767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3767
Symbol
ID	4898861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	888799
End bp	889956
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	67%
IMG OID	640114372
Product	extracellular solute-binding protein
Protein accession	YP_001045620
Protein GI	126464507
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAGC ACCGTGACCA CATCCCGGCG AAAGAGTTTC TTCAGCGGCT GGAAAGCTAC 
CGCAAGGGCT CGATCTCGCG CCGGCACTTC CTGAACGTGA CCGGCCTCGG CGCCGCGACC 
ATGGCAATGG CGGGTGCGAT GCCGGGCTTC GCCCGCCGCG CGCAGGCCCA GGGCGCGATC 
GGCGACCGCG TCGTCATCGC CACCTGGCCG AACTACCACG ACCCGGCCGA CCTCGACGCC 
TTCCGGGCCG CCACCGGCGC CGCGGTCGAC GTCAACGTCT TCGGCTCCAA CGAGGAGATG 
CTCGCGAAGC TGCAGGCGGG CGGCACGGGT TGGGACGTGG TGGTGGCCAC GAACTACACG 
ATCTCGACCT ATGTCGAGGC GGGAATCATC GAGGAGCTCG ACCTGTCGCG CATCCCGAAT 
TTCGACAGGG CTTCGACCGA CGCGCGCTTC GCCGATCCGG GCGTCATCGA CGGCAAGACC 
TACGCCATCC CGCGCAACAT CGGCACGACC GGCTATTGCA TCAATACCGC CGAGATCGAC 
GGCGAGACGC CGACCACCTG GAAGGAATTC TGGGATCTGG CGCGCGACCG GCTGTCGGGA 
CGCGGCATGG TGCATGACTA TCAGCTGACC GCCATCGGCA ACGCACTGAA ATACTACGGC 
TATTCCTTCA ACTCGGTCGA TCCGGCGGAA CTCGCGAAGG CGGAGGAGCT GCTGATCGAC 
GCCAAGCCGC ATCTCTTCGC GATTACCTCG GACTACCAGC CCTCGATGCG TTCCGGCGAT 
GCGGCGCTGT CGATGTGCTG GACCGGCGAC GCGGTGCAGC TGCAGCGCGA CATCCCCGAG 
ATTGCCTACG TGCTCGGCCG CGAGGGCGGC GAGCTCTGGT CGGACTTCTT CACCATCCCC 
GCCTCGGCCC CGCACAAGGA TGCGGCCTAT GCGCTGATCG ACTTCCTGCT CGAGCCGAAG 
ATGGCCGCGC AGGAGGCCAT GTTCCACGGC TATCCGACCG GAGACGCCCG GGTCGACGCG 
ATGCTGCCCG CCGAGATGCG CGACAGCCCG ATCCTGTTCC CGGCTGCGGA TCTCCTGAAT 
GCGCTCGAGT TCGGCGCCGC CGTCACCCTG ACCAACCCGG ACCGCGCCGA GGTCATGGCG 
CGCTTCAAAT CGGCATAA

Protein sequence

MTQHRDHIPA KEFLQRLESY RKGSISRRHF LNVTGLGAAT MAMAGAMPGF ARRAQAQGAI 
GDRVVIATWP NYHDPADLDA FRAATGAAVD VNVFGSNEEM LAKLQAGGTG WDVVVATNYT 
ISTYVEAGII EELDLSRIPN FDRASTDARF ADPGVIDGKT YAIPRNIGTT GYCINTAEID 
GETPTTWKEF WDLARDRLSG RGMVHDYQLT AIGNALKYYG YSFNSVDPAE LAKAEELLID 
AKPHLFAITS DYQPSMRSGD AALSMCWTGD AVQLQRDIPE IAYVLGREGG ELWSDFFTIP 
ASAPHKDAAY ALIDFLLEPK MAAQEAMFHG YPTGDARVDA MLPAEMRDSP ILFPAADLLN 
ALEFGAAVTL TNPDRAEVMA RFKSA