Gene Rpal_2879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_2879
Symbol
ID	6410548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	3141012
End bp	3141965
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	64%
IMG OID	642712759
Product	aliphatic sulfonates family ABC transporter, periplsmic ligand-binding protein
Protein accession	YP_001991862
Protein GI	192291257
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGTCGT CGCGTAGATC GTTGTTCGCC CTTGCCTTCG CCGCGCTCGC GGCATCGTCC 
ATCGGCTTCG CCTCTGCGGC GGACCTGAAG GAAGTCCGCA TCGGCTTCCA GAAAGCTGGC 
ATTCAGCCTG CCGTGAAGGA ACGCGGCGTC CTCGAAGCGG CGCTGAAGGA AAAAGGCCTT 
TCCGTGAAGT GGGTCGAGTT CGCCTTCGGG CCGCCGCTGC TCGAAGCGCT CAACACCGGC 
AATATCGATT TCGGTTACAC CGGCGACACC CCGCCGATCT TTGCGCAGGC CGCAGCGGCC 
AACCTGCTGT ACGTTGCCGC CCTGCCCGGC TCCGGCAAGA ACGAAGGAAT CGTCGTTCCC 
GCGAACTCGC CGATCAAGTC GGTCGCCGAT CTCAAAGGCA AGCGGCTCGC TATTCCGAAA 
GGATCGAGCG CGCATAACAC CGCAGTCGCC ATTCTCGAAA AGGCAGGCCT GCAGTTCACC 
GACGTGACCG CGGTGTACCT GCCGCCTGCC GATGGCACCG CGGCTTTCGC CGGCGGAACG 
GTAGACGCGT GGGCGATCTG GGATCCGTAC CTCGCACTGG CCGAGAAGAG CGGCGCCCGC 
GTGCTGAGCT TCGCCGGCGA CGCCCACGAC TCGATCGGCT TCTTCCTTGC CAACCGCGAA 
TTCACCAATG CCCATGGCAA CCTCGTCGCC TTGTTGAACC AGACTTTCGC CAAGGAAGCG 
CAGTGGGCAA ACGGCCATCG CGACGAGATC ACCAAATCCC TCGCCGCCTC GACCGGCGTC 
GATCCCGCCG TGGTCAGCAC TCTGGTCGGG CGATCGGTGT TTGAGGTCAC GCCGGTCACC 
GACAAGATTC TGGCGGAGCA GCAACAGACA GCGGACCGGT TCCACAAGCT CGGCCTGATC 
CCGAAACCGA TCAACGTCCG CGACATCGTC TGGAAGTGGT CGCCGGCGTC CTGA

Protein sequence

MMSSRRSLFA LAFAALAASS IGFASAADLK EVRIGFQKAG IQPAVKERGV LEAALKEKGL 
SVKWVEFAFG PPLLEALNTG NIDFGYTGDT PPIFAQAAAA NLLYVAALPG SGKNEGIVVP 
ANSPIKSVAD LKGKRLAIPK GSSAHNTAVA ILEKAGLQFT DVTAVYLPPA DGTAAFAGGT 
VDAWAIWDPY LALAEKSGAR VLSFAGDAHD SIGFFLANRE FTNAHGNLVA LLNQTFAKEA 
QWANGHRDEI TKSLAASTGV DPAVVSTLVG RSVFEVTPVT DKILAEQQQT ADRFHKLGLI 
PKPINVRDIV WKWSPAS