Gene Rsph17029_4143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_4143
Symbol
ID	4894956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009040
Strand	-
Start bp	79619
End bp	81109
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	68%
IMG OID	640110535
Product	sulphate transporter
Protein accession	YP_001041847
Protein GI	126464871
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID	[TIGR00815] high affinity sulphate transporter 1

Plasmid Coverage information

Num covering plasmid clones	81
Plasmid unclonability p-value	0.508442
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	95
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTCAT TCGCCACCTA TCGCCAGCAA TGGCTGGGCC ATGTGCGGGG CGACCTGCTC 
TCGGGGCTCG TCGTGGCGCT GGCCCTCATT CCCGAGGCCA TCGCCTTCTC GATCATCGCG 
GGCGTCGATC CGAAGGTCGG GCTCTATGCC TCCTTCTCGA TCGCCGTCGT CACCGCCATC 
GCGGGCGGAC GGCCCGGGAT GATCTCGGCC GCCACCGCAG CGACCGCCGT GCTGATGGTG 
ACCCTCGTGC GCGACCACGG GCTCCAGTAT CTGCTGGCCG CCACCGTGCT CGCGGGGCTG 
ATCCAGATCG CGCTCGGGCT CCTGAAGCTC GGCTTCGTCA TGCGCTACGT CTCGCGCTCG 
GTGATGACGG GCTTCGTCAA TGCGCTGGCG ATCCTGATCT TTCTCGCGCA ATTGCCCGAG 
CTCGACCCGC GGACCGTGCC GCCGCTGACC TATCTCCTCG TGGCGGCGGG CCTGGCCATC 
ATCTATCTCT TCCCGCGCCT CACCCGCGCC GTGCCCTCGC CGCTCGTCAC CATCGTCGTG 
CTGACGGCGC TGACGCTCGG CCTCGGGCTC GACGTGCGGA CGGTGGGCGA CATGGGCGTG 
CTGCCCGACA CGCTGCCCGT CTTCCTGATC CCGGACATTC CCCTGACCTT CGAGACACTG 
CGGATCATCC TGCCCCCGGC CACAGCCGTG GCGGTGGTGG GGCTTCTGGA AAGCCTGATG 
ACGCAGACCC TCGTCGACGA GCTGACCGAC ACCCGCTCGA GCCGCAATCA GGAATGTATC 
GGGCAGGGGC TGGCCAACGC CGCCACCGGC TTCATCGGCG GCATGGCGGG CTGCGCCATG 
ATCGGCCAGT CGATGATCAA CGTGAAGTCG GGCGGGCGCG GGCGGCTGTC CTGCTTCGTG 
GCGGGCGTGT TCCTGCTGAT CCTCGTCGTG GGGCTCGGCG ATGTCGTCAG CCGGATCCCG 
ATGGCCGCGC TCGTGGCCAT CATGATCATG GTCTCGATCG GCACCTTCTC CTGGTCGTCC 
CTCAAGGCGC TGCGCACCCA TCCCCGGTCC TCCTCCGTGG TGATGCTGGC GACGGTGGCG 
ACCGTGGTCT GGACCCACAA TCTGGCCCTG GGCGTCCTCG TGGGCGTGCT GCTCTCGGGG 
ATCTTCTTCG CCGCCAAGAT TGCGCAGCTC TTCGCGGTCA GCTCCGAACT CTCGGCCTGC 
GGGCGCGCGC GGACCTACCG GGTCGAGGGC CAGCTCTTCT ACGGCTCGGT CGAGGATTTC 
ATGGCCGCCT TCGACTTCCG CGAACCGCTC GAGCGCGTCA CCATCGACGT GAGCCGCGCC 
CATATCTGGG ACATCTCCTC GGTGCAGGCG CTCGACATGG CGGTGCTGAA GTTCCGCCGC 
GAGGGGGCCG AGGTGCGGAT CGTGGGCATG AACGAGGCCT CCGAGACTCT CGTCGACCGG 
CTGGCCCTGC ACGACAGGCC GGGAGCCATG GACCGGCTCA CGGCCCATTG A

Protein sequence

MISFATYRQQ WLGHVRGDLL SGLVVALALI PEAIAFSIIA GVDPKVGLYA SFSIAVVTAI 
AGGRPGMISA ATAATAVLMV TLVRDHGLQY LLAATVLAGL IQIALGLLKL GFVMRYVSRS 
VMTGFVNALA ILIFLAQLPE LDPRTVPPLT YLLVAAGLAI IYLFPRLTRA VPSPLVTIVV 
LTALTLGLGL DVRTVGDMGV LPDTLPVFLI PDIPLTFETL RIILPPATAV AVVGLLESLM 
TQTLVDELTD TRSSRNQECI GQGLANAATG FIGGMAGCAM IGQSMINVKS GGRGRLSCFV 
AGVFLLILVV GLGDVVSRIP MAALVAIMIM VSIGTFSWSS LKALRTHPRS SSVVMLATVA 
TVVWTHNLAL GVLVGVLLSG IFFAAKIAQL FAVSSELSAC GRARTYRVEG QLFYGSVEDF 
MAAFDFREPL ERVTIDVSRA HIWDISSVQA LDMAVLKFRR EGAEVRIVGM NEASETLVDR 
LALHDRPGAM DRLTAH