Gene Rsph17029_1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1990
Symbol
ID	4895142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	2109928
End bp	2111028
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	68%
IMG OID	640112584
Product	extracellular solute-binding protein
Protein accession	YP_001043866
Protein GI	126462752
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGA AACTTGCACT GGCCGCCTCG GTCAGCCTCG CCGCGATGGG CGCGGCCTCG 
GGCGCCTTCG CCCAGAGCGC CGAGCTCGTC GAGGCCGCCA AGGCCGAAGG GATGCTGACC 
ACCATCGCCC TGCCCCACAA CTGGTGCGGC TACGGCGACG TGATCGCGGG CTTCAAGGCA 
AAATATCCCG AAATCACCGT GAACGAGCTG AACCCCGACG CGGGCTCGGC CGACGAGATC 
GAGGCGATCC GGGCGAACAA GGACAACAAG GGCCCGCAGG CGCCCGACGT GATCGACGTG 
GGCCTCGCCT TCGGGCCGCA GGCCAAGGAC GAGGGCCTGA TCGCCCCCTA CAAGGTCGAG 
ACCTGGGACG AGATCCCCGC CGAGATCAAG GATGCCGACG GCTACTGGTA TGGCGACTAC 
TACGGCGTGA TGTCCTTCGG GGTGAACACC GATCTCGTGC AGGAAGTGCC GAAGAGCTGG 
GAGGCGCTGC TCGACAGCCA GTATGCCAAT GCCTTCGCGC TGGCGGGCGA CCCGCGCGCC 
TCGAACCAGG CGATCCTGGC CGTGATGTCG GCCGGCATCG CCGACGGCAC TGAGCCCGGC 
GAGGCCTCGG GCAAGAAGGG GCTCGAGTTC TTCGGCAAGC TGAACAAGGC CGGCGGCTTC 
GTGCCGGTGA TCGGCAAGGC CGGCACCATC GCCCAGGGTC AGACCCCGAT CGTCGCCGCT 
TGGGACTACA ACCTGCTGTC CTGGCGCGAC GAGCTGAAGG GCAACCCGCC CATGGAAGTG 
GTGATCCCGG AGGGCCCGAG CCTCGCCGGC GTCTATGTGC AGGCGATCTC GGCCTTCGCG 
CCGCACCCGA ACGCGGCGAA GCTCTGGATG GAATATCTCT ATTCGGACGA AGGTCAGCTC 
GGCTGGCTCA AGGGCTACTG CCACCCGGCG CGCTTCAACG CGATGGTCGA GGCCGGCAAG 
ATCCCGCAGG AGCTGCTCGA CGCCCTGCCG CCCGCCGAAG GCTATGCCCG CGCGGTCTTC 
CCGACCGTCG AGCAGCAGGA GGCCAACAAG GCGGCCGTGA CGGCCGGCTG GGATGGTGTG 
GTCGGCGCCA ACGTGCAATG A

Protein sequence

MTMKLALAAS VSLAAMGAAS GAFAQSAELV EAAKAEGMLT TIALPHNWCG YGDVIAGFKA 
KYPEITVNEL NPDAGSADEI EAIRANKDNK GPQAPDVIDV GLAFGPQAKD EGLIAPYKVE 
TWDEIPAEIK DADGYWYGDY YGVMSFGVNT DLVQEVPKSW EALLDSQYAN AFALAGDPRA 
SNQAILAVMS AGIADGTEPG EASGKKGLEF FGKLNKAGGF VPVIGKAGTI AQGQTPIVAA 
WDYNLLSWRD ELKGNPPMEV VIPEGPSLAG VYVQAISAFA PHPNAAKLWM EYLYSDEGQL 
GWLKGYCHPA RFNAMVEAGK IPQELLDALP PAEGYARAVF PTVEQQEANK AAVTAGWDGV 
VGANVQ