Gene Rru_A1449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A1449
Symbol
ID	3834864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	1713883
End bp	1714959
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	64%
IMG OID	637825539
Product	bile acid:sodium symporter
Protein accession	YP_426537
Protein GI	83592785
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.939169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGTCCG TTCACAGCGA TCCCCCCGCC GCCAAGGTCT CTGGCAAGCC GATGGGGTTT 
TTCGAGCGTA CCCTGACCCT GTGGGTCGGG CTGTGCATCG TGGTCGGGGT GACCTTGGGC 
CATGTCGCGC CCGGCCCCTT TCAGGCCATC GCCGGGCTGG AAATCGCCCA GGTCAATCTG 
CCCGTCGCCC TGCTGATCTG GCTGATGATC ATTCCGATGC TGCTGAAGAT CGACTTCGCC 
GCGCTGGGCA CCGTCGGGCG GCACTGGAAG GGCATGGGCG TGACCCTGTT CATCAACTGG 
GGGGTCAAGC CGTTTTCCAT GGCCCTGCTC GGCTGGTTGT TCATCAGCAC GCTGTTTCGG 
CCCTGGCTGC CCGCCGATCA GATCGACAGC TATATCGCCG GGTTGATCCT GCTGGCCGCC 
GCGCCCTGCA CGGCGATGGT CTTCGTCTGG TCCAACCTGA CCGGCGGCGA ACCCAATTTC 
ACCCTGTCGC AGGTGGCGCT GAACGACCTG ATCATGGTCT TCGCCTTCGC CCCCATCGTC 
GGGTTGCTGC TTGGCCTGTC GTCGATCACC ATTCCCTGGG ACACCCTGCT GATCTCGGTC 
GCGCTGTATA TCGTGGTGCC GGTGATCATC GCCCAGATCT GGCGGCGCGC CCTGGTTGCG 
CGCGGTCCCC AGGCCGTGGA GCGCGTGCTC AAAACCCTGC ATCCGCTGTC TTTGGGCGCT 
CTTCTCGCCA CGCTGGTGCT GCTGTTTGGC TTCCAGGGCG AACAGATCCT CGCCCAACCA 
CTGATCATCG CGCTGCTGGC GGTGCCGATC ACCATCCAGG TCTATTTCAA CAGCGGCCTT 
GCCTATCTGC TGTCGAAGAA GCTGGGCGTC GCCCATTGCG TGGCCGGACC GGCGGCGCTG 
ATCGGCGCCA GCAACTTCTT CGAACTGGCC GTCGCCGCCG CGATCAGCCT GTTCGGCTTC 
CAGTCCGGGG CGGCGCTGGC CACCGTGGTC GGCGTGCTGA TCGAAGTGCC GGTGATGCTG 
TCGGTGGTGA AAATCGTCAA TGCCTCCAAG GGCTGGTACG AAGGAAAGCC CGCATGA

Protein sequence

MMSVHSDPPA AKVSGKPMGF FERTLTLWVG LCIVVGVTLG HVAPGPFQAI AGLEIAQVNL 
PVALLIWLMI IPMLLKIDFA ALGTVGRHWK GMGVTLFINW GVKPFSMALL GWLFISTLFR 
PWLPADQIDS YIAGLILLAA APCTAMVFVW SNLTGGEPNF TLSQVALNDL IMVFAFAPIV 
GLLLGLSSIT IPWDTLLISV ALYIVVPVII AQIWRRALVA RGPQAVERVL KTLHPLSLGA 
LLATLVLLFG FQGEQILAQP LIIALLAVPI TIQVYFNSGL AYLLSKKLGV AHCVAGPAAL 
IGASNFFELA VAAAISLFGF QSGAALATVV GVLIEVPVML SVVKIVNASK GWYEGKPA