Gene Rsph17029_3889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3889
Symbol
ID	4898333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	1020468
End bp	1021475
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	67%
IMG OID	640114493
Product	nitrate/sulfonate/bicarbonate ABC transporter periplasmic ligand-binding protein
Protein accession	YP_001045740
Protein GI	126464627
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.475299
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.125658
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCC ACAAGACACT GACGCCCTGG GCGGCGGCGC TTCTGCTCGC CTCGACGGCC 
TGGCCCGCGC TGGCCGAGGT TTCGACGGTG CGCCTCGCCA AGCAGTTCGG CATCGGCTAC 
CTGCCGCTCA CGCTGGTCGA GGAGCTGGAC CTGCTCGAGA AGCACGCGGC CGCCTCGGGC 
CACGAGATCA CGACCGAATG GCTGCGCTTC ACCGGCGGCT CGGGCATGAA CGAGGCGCTG 
CTGTCGGGCA ACCTCGATCT GGCGGCGGGC GGCACCGGGC CGCTCTTCAC CATCTGGGCC 
CGCACGCGCG AGAACCTGAA GATCAAGGGC GTGGCGGCGC TGGCCTCGAT GCCGCTGCAT 
CTGATGACCT CGAACCCCGA GGTGAAGACG CTGGCCGACT TCGGACAGGG CGACAAGATC 
GCCCTGCCCG CCGTCAAGAC CTCGATCCAG GCCGTCACGC TGCAGATGGC CTCCAAGCAG 
GCCTTCGGGG CGGACAAGGC CACCGCCATG GATGCCTTCA CCGTTTCGAT GGGCCATCCC 
GACGCGCAGC TCGCGCTGAC CGGCGGGCAG TCCGAAGTGA CGGCGCATTT CGGCTCGCCG 
CCGTTCCAGA ACCTCGAGGC CAAGGTCGAG GGCATCCACA AGGTGCTCGA CAGCTATGAC 
GTGCTCGGCG GCTCGCACAC CTTCACCGTG GTCTGGGCGG CCGACAAGTT CATCTCGGAG 
AACCCCGAGA TCACCAAGGC CTTCATGGCG GCGCTCGAGG AAAGCATGGA GCTGATCCGC 
ACCGACCCCG AGAAGGCGGC CGAGATCTGG ATGGCGGCCG AGCGCAGCCC TCTGAGCCGG 
GAAGAGGTCG TGGCGCTGAT CCAGGACGAG CAGACCGTCT GGACCACCAC GCCCGAGCGC 
ACCCTGCCCT ATGTCGAGTT CCTGAGCGAG TCCGGCCTCA TCAAGACCTC GGCCGAGGAC 
TGGAGCGAGA TCTTCTTCGA CACGATGTCG GGCAAGGAGG GAAGCTGA

Protein sequence

MKIHKTLTPW AAALLLASTA WPALAEVSTV RLAKQFGIGY LPLTLVEELD LLEKHAAASG 
HEITTEWLRF TGGSGMNEAL LSGNLDLAAG GTGPLFTIWA RTRENLKIKG VAALASMPLH 
LMTSNPEVKT LADFGQGDKI ALPAVKTSIQ AVTLQMASKQ AFGADKATAM DAFTVSMGHP 
DAQLALTGGQ SEVTAHFGSP PFQNLEAKVE GIHKVLDSYD VLGGSHTFTV VWAADKFISE 
NPEITKAFMA ALEESMELIR TDPEKAAEIW MAAERSPLSR EEVVALIQDE QTVWTTTPER 
TLPYVEFLSE SGLIKTSAED WSEIFFDTMS GKEGS