Gene Rsph17029_3636 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3636
Symbol
ID	4898644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	734649
End bp	735680
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	66%
IMG OID	640114244
Product	extracellular solute-binding protein
Protein accession	YP_001045498
Protein GI	126464385
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.93135
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.343272
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACTC GACGCCATCT GATGGCGAGC ATCGGCGCAT CCGCCCTCAT GCTGCCGCTC 
GCGCGCCGCG CCATGGCGCA GCAGCCCTTC GTGATCCCGA CCTATGGCGG GACATGGGCG 
AAGCTCTGGG AAGAGACGCT GGTGCCCGAA TTCACCTCGG CCACGGGCAT CCAGAGCCAG 
ATCGACGTGG GGCTCGGCAA GGATTTCGTC TCGAAGATCC GCGCCGGCGG CGGGGCTTCG 
CCCTATTCGG TCTTCATGGG CAACGAGAAC ATCGCGGCCA CCCTGCGCGC CGAAGGCTTC 
TTCGAGCCGC TCGACATGTC GAAGGTCCCG AACGCCGCCA ACATGTATGA CGGCCTCATC 
AACCCGGGCA ACAACGGGCT GCGCGCGATC GTCTCGCCCA TCGGTCTCGC CTGGCGGACC 
GACATGATCC AGACGCCGCC CAAGGCCTGG ACCGACCTGT GGGAGAACCC GGAATATGCC 
GGGCAGATCG GCCTCTACCA GATCGGCAAC ACCGGGGCAC AGCTCTTCCT GCGGCTCGCA 
GGGCGGCTCT TCGGCTCGGG CGATACCGAC ATCGACACCG CCTTCACGAA GATCAAGGAG 
CTGCAGCCCT TCACCCAGGC CTCCTGGAGC GGCGAGGTTG CGGCCCAGCT CATGCGCGGC 
GACGTGGCGA TTGCCCCGGT GGACTGGACC GAGATCCTGA CGCTGCAGGA CAAGGGCGCC 
CCGGTCGAGA TCATCGTGCC CGAGGAAGGG GTGCTGTCCT ACGAGCAGAG CTTCAACATC 
GTGAAGACCG GGCCCGACAA GGAAGCGGCG CACGCCTATA TCAACTTCCT CCTCGACCCG 
AAGATCCAGT CGATCCTCGC GGACACGTTC TACGTCTCGC CGGCCAACCG CGAGGCCGTC 
ATCAGCGAGG CAACCTCGCC GCGCCTGCCG GTGCAGGGCG AGGCCATGTC GAAGATCATC 
CGCTTCGAGT GGGACAATTA CATCGACATC GCAGCCGAGG TCGCCGACCG CTGGAACCGC 
GAAATCGGCT GA

Protein sequence

MITRRHLMAS IGASALMLPL ARRAMAQQPF VIPTYGGTWA KLWEETLVPE FTSATGIQSQ 
IDVGLGKDFV SKIRAGGGAS PYSVFMGNEN IAATLRAEGF FEPLDMSKVP NAANMYDGLI 
NPGNNGLRAI VSPIGLAWRT DMIQTPPKAW TDLWENPEYA GQIGLYQIGN TGAQLFLRLA 
GRLFGSGDTD IDTAFTKIKE LQPFTQASWS GEVAAQLMRG DVAIAPVDWT EILTLQDKGA 
PVEIIVPEEG VLSYEQSFNI VKTGPDKEAA HAYINFLLDP KIQSILADTF YVSPANREAV 
ISEATSPRLP VQGEAMSKII RFEWDNYIDI AAEVADRWNR EIG