Gene Rsph17029_3888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3888
Symbol
ID	4898894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	1019476
End bp	1020468
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	66%
IMG OID	640114492
Product	nitrate/sulfonate/bicarbonate ABC transporter periplasmic ligand-binding protein
Protein accession	YP_001045739
Protein GI	126464626
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0640866
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGG ATCTCCGCAC CGGACTGGCC GCCCTCGCGC TCGCGGCGGG GCTCGCCCTG 
CCCGCCGCCC CGGCCCTCGC CGAAATGTCC GAGATCACCA TCGCGCGCCA GCCAAGCATC 
GGGCACCTGC CGCTGATGAT CATGCAGGAG CGGCGGCTGA TCGAGACGAT GGCCGAGGCC 
GAGGGGCTGG GCGAGGTGAA GGTGAATTAC GCCACCTTCG CCGGCGGCTC GAACATGAAC 
GACGCGCTTC TGTCGAACAC GATCCAGTTC GCCGCGGGCG GCGTGCCGCC GCTGATCCTG 
CTCTGGTCGA AGACGGCCGG AACCTCGAAC GAGGTGAAGG GCGTGGCGGC GATGAACTCG 
ATGCCGCTCC TGATGAACGT CAACCGCGAG GACATACGCT CGATCGAGGA TTTCAAGCCG 
GGCGACAAGA TCGCCCTGCC CTCGGTCAAG GTGTCGGTGC AGGCGATGGT GCTGCAGATG 
GCGGCGGCGA AGATCTGGGG CGACGAGAAT TACGGCAAGC TCGACCCGCT GACCGTCTCG 
ATGTCCCATC CCGACGGGCT CGCGGCGCTC CTCGCGAAGC AGGAGGTGAC GGCCCATTTC 
ACCGCCTCGC CCGCGCAGGA CATGGCGCTG CGCGAGCCGG GCGTCCATAC GGTGCTGAAC 
TCGTTCGACG TGATGGGCGG GCCCGTGACC TTCAACGTCG TCTGGACGAC CAAGGCCTTC 
CATGACGACA ATCCGAAGCT CTTCGACATC TTCCGCCGCG CGCTGGCTCA GGCGGTCGAG 
GTGGTGAACG AGGATCCGGC CGAGGCGGTG CAGGTCTACC TCCGTCAGGC GGGCAATGCG 
ACGGACCCCG AGCTTCTGGC CTCGATCCTC GCCGATCCGC AGGTCGACTA TACCGTCGAG 
CCTTCGGGCA TCGACAAGTA TCTCGACTTC ATGCGCCGGA TCGGGACGGT GAAGGACAAC 
GGCCAGCCGT GGGAGGCGAT GTTCTTCGAA TAG

Protein sequence

MTMDLRTGLA ALALAAGLAL PAAPALAEMS EITIARQPSI GHLPLMIMQE RRLIETMAEA 
EGLGEVKVNY ATFAGGSNMN DALLSNTIQF AAGGVPPLIL LWSKTAGTSN EVKGVAAMNS 
MPLLMNVNRE DIRSIEDFKP GDKIALPSVK VSVQAMVLQM AAAKIWGDEN YGKLDPLTVS 
MSHPDGLAAL LAKQEVTAHF TASPAQDMAL REPGVHTVLN SFDVMGGPVT FNVVWTTKAF 
HDDNPKLFDI FRRALAQAVE VVNEDPAEAV QVYLRQAGNA TDPELLASIL ADPQVDYTVE 
PSGIDKYLDF MRRIGTVKDN GQPWEAMFFE