Gene Rpal_2884 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_2884
Symbol
ID	6410553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	3145580
End bp	3146527
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	62%
IMG OID	642712764
Product	aliphatic sulfonates family ABC transporter, periplsmic ligand-binding protein
Protein accession	YP_001991867
Protein GI	192291262
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.877922
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCGCC GACAATTCCT CCAATTATCT GCCGGAACCG CTCTACTGCC GATTCTGTCA 
CGCTCAGCCG CAGCTGAGCC GCTGACCGAG ATCCGCATCG GCTATCAGAA GAACGGCGTG 
TTGGTAATCG CGCGGCAACG GCGGACGCTG GAGGATCACT TCGCCGCACA GAATATCGGC 
ATCAAATGGC TGGAATTTTC GTCCGGTCCC CCGATGCTCG AGGCGATGAA CGTCGGCAGC 
ATTCACTATG GCGCCGTCGG TGACGCGCCG CCGATCTTTG CCCAGGCTGC TGGCGCTGCA 
ATCGTCTACG CAGCAGGCCA GCCGATCACC AACGGTCAGG GTATCCTGGT TCCGAAAGAT 
TCGCCGATCC GCGGTCTCGC CGATCTCAAG GGCAAGCGCA TCGGCTTCAC AAAGGGGTCG 
AGCGCCCACA ATGTGGTCTT GCTGGCGCTC AAGAAGGCCG GCCTGACCTA TGGCGACATC 
ACGCCGGTCT ACCTGTCGCC GCCGGACGCC GGCCCCGCAT TCGCGCAAGG CGGCATCGAT 
GCCTGGTCGA TCTGGGACCC ATATTTCGCG ATCGGCGAAT TGAAGCAGAA TGGGCGCGTG 
CTGATCAATG CATCCGAGGT CGGCCGGACC AACTCGTTCT ACATCGCCAA CCGTGAATTC 
GCTCAACGAA ATGCGTTGAT CCTCAAGCAG ATCATCGACG TCACCAGCGC GACCGCGCGA 
TGGGCAGAAG ATCATCGCGG CGACGTCGCT CAGTCCCTCA GTGCCGTCAC AGGCATCCCG 
CTCGACATCC AGACGATCGC TGCCAACCGG TCGTCATTTG TGGTTGGGCC GGTGACCGAC 
GAGATCGTCT CGACCCAGCA GGACGTCGCC GACCGCTTCC ATCAGCTAGG CCTGATTCCC 
CGCCCGATCG TGGTGCGCGA TGCAGTGTGG CGGCCGCCAC AGGCTTGA

Protein sequence

MQRRQFLQLS AGTALLPILS RSAAAEPLTE IRIGYQKNGV LVIARQRRTL EDHFAAQNIG 
IKWLEFSSGP PMLEAMNVGS IHYGAVGDAP PIFAQAAGAA IVYAAGQPIT NGQGILVPKD 
SPIRGLADLK GKRIGFTKGS SAHNVVLLAL KKAGLTYGDI TPVYLSPPDA GPAFAQGGID 
AWSIWDPYFA IGELKQNGRV LINASEVGRT NSFYIANREF AQRNALILKQ IIDVTSATAR 
WAEDHRGDVA QSLSAVTGIP LDIQTIAANR SSFVVGPVTD EIVSTQQDVA DRFHQLGLIP 
RPIVVRDAVW RPPQA