Gene Rsph17025_1378 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1378
Symbol
ID	5083052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	1406172
End bp	1407191
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	64%
IMG OID	640482936
Product	extracellular solute-binding protein
Protein accession	YP_001167580
Protein GI	146277421
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.303939
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.180418
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACATC TCGCAGCCAC AGCCCTGCTC CTCGCATCGA CCGGCCTCGC GGGGGCGGCC 
GAGTTGAACC TCTACAACTG GGGCAACTAC ACGAGCGCCG AGTTGCTGGC GAAGTTCGAG 
CAGGAGACCG GCATCAAGGT CACGGTGACC GACTACGACA GCAACGACAC GGCGCTGGCC 
AAGATCGAGG CGGGCGGGCA CGGGTTCGAC CTCGTGGTGC CCTCGGCCAA CTATGTGGGC 
ATCTTCCGCG ACAAGGGCCT CCTGACCGAG CTGGACCTGT CGAGGATCCC GAACCACGCC 
AACATCGCCC CCGAATGGAA GGATGTGGAG TGGGATCCGG GCCGCACCCA TACGGTGCCA 
TGGCAGTGGG GCACCACCGC GATCTCGGTC AATACCGCCG TTTACAAGGG CGACATCAAC 
ACGTCGGCGG TCTGGCTCGA GGTGCCGGAC GAGCTGAAGG GCAAGGTCAA TGTCGTGCCC 
GAGATGAACG ATGTGGTGGC GCTGGCCACG ATGTATGCCG GCGGCGAGCC CTGCACCGAG 
GATCTCGAGG TGCTCAAGAA GGCGCGCGAC CTGCTGCTTG CCGCCAAGCC GCACTGGATC 
TCCATGGATT ACGGCGCCAC CGAAAAGCTC TCGAACAACG ACTGGGCGGC CTCGGTGAAC 
TGGTCCGGCT CGTCGATGCG CGCGCGGCTC GCCAATCCCG AGGTGGCCTA TGGCTATCCC 
CGGGAGGGCT TCATCACCTT CATGGACTCG GTGGCGCTGC TGCGCGATGC CCGCAATGTC 
GAAGAGGCCT ACCAGTTCCT GAACTTCATC CTCGAGCCGG AGAATGCGGC GCTGATCTCG 
GCCTTTGCGC GCTATTCGCC CGGTGTCAGC GGGGCCGAAG AGTTCCTGCC CGAGGACATG 
AAGACGGCGC CCGAAGTGGT GATCACGGCC GAGTTCGCCG ACAAGGGCGT GTTCCTGCCG 
GCCTGCGGGC CGAAGGCGCA GGAATACATC ACCGCGATCT GGACCGAGCT TCAGAAATAG

Protein sequence

MTHLAATALL LASTGLAGAA ELNLYNWGNY TSAELLAKFE QETGIKVTVT DYDSNDTALA 
KIEAGGHGFD LVVPSANYVG IFRDKGLLTE LDLSRIPNHA NIAPEWKDVE WDPGRTHTVP 
WQWGTTAISV NTAVYKGDIN TSAVWLEVPD ELKGKVNVVP EMNDVVALAT MYAGGEPCTE 
DLEVLKKARD LLLAAKPHWI SMDYGATEKL SNNDWAASVN WSGSSMRARL ANPEVAYGYP 
REGFITFMDS VALLRDARNV EEAYQFLNFI LEPENAALIS AFARYSPGVS GAEEFLPEDM 
KTAPEVVITA EFADKGVFLP ACGPKAQEYI TAIWTELQK