Gene RPD_2108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2108
Symbol
ID	4022590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2359074
End bp	2360099
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	62%
IMG OID	637962301
Product	extracellular solute-binding protein
Protein accession	YP_569244
Protein GI	91976585
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAACAA TAATCGCCAG ACTCGCCGCG ATGCTGTCGG CGCTGTTGCT CACCACCACG 
CTCGCCGTTG CGCAGAGCAA GGTGACGATC GCGATCGGCG GCGGGGCATG TCTTTGCTAT 
CTGCCGACGG TGCTGGCCAA GCAACTCGGC GAATACGACA AGGCCGGGCT CAGCGTCGAA 
CTCGTCGATC TCAAGGGTGG TTCGGATGCG CTGAAGGCCG TGCTCGGCGG CAGCGCCGAC 
GTGGTGTCGG GCTATTTCGA TCACACGGTG AATCTCGCCG CCAAGAAGCA GGAGATGCAG 
TCGTTCGTGG TCTATGATCG CTATCCGGGG CTGGTGCTGG CGGTTTCGCC TGGGCACACG 
GCGGAGATCA AGTCGATCAA GGACCTCGCC GGCAAAAAGG TCGGCGTCAG CGCGCCGGGC 
TCATCGACCG ATTTCTTTCT CAAGTATCTT TTGAAGAAGA ACGGCGTTGA TCCGAACAAC 
GTGTCGGTGA TCGGCGTCGG CCTCGGCGCC ACCGCGGTGG CGGCGATGCA GCAGGGCCAG 
ATCGACGCCG CGGTGATGCT CGATCCGGCG GTGACGATTC TGCAGAGCGC CCACGCTGAT 
TTGCGTATCC TCAGCGATAC GCGGACCGAG CACGACACCC GCGAGGTGTT CGGCGGTGAC 
TATCCCGGCG GTGCGCTGTA CGCGACGGTG GCCTGGATCA AGGCGCATCC GAAGGAGGCG 
CAGGGACTGA CCAACGCCAT CCTGAATACG CTGGGCTGGA TTCACACGCA TTCGGCGGAC 
GAGATCGCCG ACAGGATGCC GCCCAACATC GTCGGCAAGG ACAGGGCGCA ATATGTCGCC 
GCGTTGAAAA ACACGATTCC GATGTATTCG ACCACCGGGT TGATGGACCC GAAGGGCGCC 
GATGCGGTGC TCGCGGTGTT CAGCGTCGGC TCGCCCGAGG TCGCGAAAGC CAATATCGAC 
GTGACCAAGA CCTACACCAA CGCTTTCGTC GAGCAAGCGG CGAAGACGTC GGGTGCGGCG 
AAGTAA

Protein sequence

MKTIIARLAA MLSALLLTTT LAVAQSKVTI AIGGGACLCY LPTVLAKQLG EYDKAGLSVE 
LVDLKGGSDA LKAVLGGSAD VVSGYFDHTV NLAAKKQEMQ SFVVYDRYPG LVLAVSPGHT 
AEIKSIKDLA GKKVGVSAPG SSTDFFLKYL LKKNGVDPNN VSVIGVGLGA TAVAAMQQGQ 
IDAAVMLDPA VTILQSAHAD LRILSDTRTE HDTREVFGGD YPGGALYATV AWIKAHPKEA 
QGLTNAILNT LGWIHTHSAD EIADRMPPNI VGKDRAQYVA ALKNTIPMYS TTGLMDPKGA 
DAVLAVFSVG SPEVAKANID VTKTYTNAFV EQAAKTSGAA K