Gene Rsph17029_1557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1557
Symbol
ID	4896490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1637646
End bp	1638656
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	67%
IMG OID	640112147
Product	extracellular solute-binding protein
Protein accession	YP_001043439
Protein GI	126462325
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.456805
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCACG CTGCTCTTCC GCTGGTAGCC CTTGCCCTTG GCACCACCGC CCTGCCCGCT 
CTGGCCGACG AGGTGAACAT CTATTCGCAC CGTCAGCCCG AGCTGATCCA GCCGCTGGTG 
GATGCCTTCA CCGCCGAGAC CGGCATCGAC GTCAATGTGG CCTTCGTCGA CAAGGGCATG 
GCGGAACGGC TCGTGGCCGA AGGCAACCGC TCGCCGGCCG ATCTGGTGCT GACGGTCGAT 
ATCGCGCGGC TGATGCAGGT CGTCGAGGCG GGCGTCACGC AGCCGGTCGA GTCCGACGTG 
CTCTCCTCGA ACATCCCGGC CGAGTTCCGC GATCCGGCGG GCCACTGGTT CGGACTGACC 
AGCCGGGCCC GCATCGTCTA TGCCTCGAAG GAGCGGGTGA AGGACGGCGA GGTCACGACC 
TACGAGGATC TCGCCTCGGA CAAGTGGAAG GGCCGGATCT GCACCCGCTC CTTCACCAGC 
GACTACAACG TGGCGCTGAC CGGCGCCGTT ATCGCGCATC ACGGCACCGA GGGCGCGAAG 
ACCTGGCTCG AAGGGGTGAA GGCGAACCTC GCCCGCAAGC CCGAAGGCAA CGACCGCGAT 
CAGGTGAAGT CGATCTGGGC CGGCGAATGC GACATCAGCC TCGGCAACAC CTACTACATG 
GGGCAGATGC TGGCCGATCC CGAGCAGAAA GAATGGGCGG ACTCGGTCCG CATCGTCTTC 
CCGACCTTCG AGGGCGGCGG CACCCACATG AACATCTCGG GCGTCGCCAT GACGAAGGCC 
GCGCCGAACC GCGAGGCCGC GCTGAAGCTG ATGGAGTGGC TTGCCTCCGA CGAGGCGCAG 
CGGATCTATG CCGAGACGAA CCACGAGTTC CCGGTCGAGC CCGGTGTCGC GCGCTCGGAG 
CTGGTGCAGA GCTGGGGCGA GTTCACGCCC GACGCGGTCA GCCTCGCCGA GGTGGCCTCG 
CATCGCGGCG AGGCGCTGAA GCTGATCGAG ACCGTGGATT TCGACGGCTG A

Protein sequence

MRHAALPLVA LALGTTALPA LADEVNIYSH RQPELIQPLV DAFTAETGID VNVAFVDKGM 
AERLVAEGNR SPADLVLTVD IARLMQVVEA GVTQPVESDV LSSNIPAEFR DPAGHWFGLT 
SRARIVYASK ERVKDGEVTT YEDLASDKWK GRICTRSFTS DYNVALTGAV IAHHGTEGAK 
TWLEGVKANL ARKPEGNDRD QVKSIWAGEC DISLGNTYYM GQMLADPEQK EWADSVRIVF 
PTFEGGGTHM NISGVAMTKA APNREAALKL MEWLASDEAQ RIYAETNHEF PVEPGVARSE 
LVQSWGEFTP DAVSLAEVAS HRGEALKLIE TVDFDG