Gene Rru_B0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_B0020
Symbol
ID	3833351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007641
Strand	+
Start bp	18918
End bp	20465
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	67%
IMG OID	637824039
Product	major facilitator transporter
Protein accession	YP_425056
Protein GI	83582750
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGGGCG TATCCACTCC CCGGATTCCA GCGGCGGATG CGCCGTTCGC CTCGCCCGAC 
ACCCCCGCCC GTCGCCAAGC GATCCTCGCG GTCATGGTCG GCTGCGCCGC TCTGGTCTTT 
GGCCTGGGCG CCAGCCTGAA CCTAGCGGTC GGGCGTATCG CCACCAGCCC GCTCCATCCT 
TCCGCCACGG CGGTGCTGTG GATCGTCGAC ACATATCTCG TGGTCTTCGG TTGCCTGCTG 
ATTCCGGCCG GGGCCATCGG GGATCGCTAT GGCCGCAAGC AGGCCATGCT GGCGGGTCTC 
ACGTTCCTGG CTGTTGGCTC CCTGCTGTCC GCCGTTGCGG CCACCGTGCC CGTGCTGCTG 
GCCGGCCGAG CAGTCGCCGG CGCGGGCGCG GCACTGATCC TGCCGAACAG CCTCGCGCTG 
GTCGTCCAGG TCTATCCGGC CGACCAGAAA TCCCATGCCA TCGCTGTATG GACCGGCATG 
ACCGGCCTGG GCGGCGCGCT CGGGAATATC CTCGGCGGGC TTGTGCTGCA GTTCGCCGAA 
TGGCAGGCGA TCTTCACCGT TGCGGTGCCG TTGGCCCTTG CAGGCCTCGC GCTGACGGCG 
TGGCTGGCGC CACGGCAAGC GGGACACGAG CATCCGCTCG ACCTCGTCGG CGCCGGCATT 
CTCATGCTGA GCATATTCGC CCTGTTGACG GGACTGATCG AAGGCCAGGA GCTGGGCTGG 
GCCTCGACGG AGGTGATCGG CGCCTTATGC GCCGCGGCGG CGCTCCTCGC AGTATTCCTC 
ACCACCGCGG CGAGGCGGAA GCACCCCCTC GTCGATCCGC GCATCTTCCG TGCCCGCGGC 
CTCTGCGCCG GCATGCTCGG CATCACCGCA TCCTTCATCG CCATGTATTC GCTGTTCTAT 
CTGAACGGCC AATACCTGAT GAGCGTGAAG GGCTATCCGC CGGCTCTGGC CGGCATATGC 
ACCCTGCCGC TGGTGGTCGT CCTGTTCTGG CTGTCACCGC GCAGCGTCCA GCTCGCCCGT 
CGCTTCGGTG CGCGGCCGGT GGTCGCCGTC GGCCTGGCAA TGCTCATCGT CGGGCTGGGC 
CTTCTGCGGC TTTGCGGCGC GGATACGTCC TACTGGTTCT ATGCCGCGAG CATCGGCGTT 
ATCGGCATCG GCTCGGCGCT GTCCAATCCT GTCCTGTCGA CCGCGATCAT CGGTGCGCTG 
CCGCCGCATC AGGCAGGTGT CGGCTCCGGC ATCAACAGCT TCACGCGTGA AATCGGCGGC 
GCTTTGGGCG TTGCTCTGTT TGGCAGCCTG CTGGGGAGCA GCTTCCCGTC GCGTTTGCCC 
GACACCCTGG CGCAGGCTCA TGGCGCTGTG CAACGGTCGG TCGGCGCCGC ACTGGCCTAT 
GCAGAATCCC TGCCAGGAAC GGCGGCCAAT CAGACGGTAC AGGTCGTACG TCAAGCCTTC 
TCCGGCGCAA TGGCACAATC GCTGCTCACG GTGATGCTGG TTCTGGCGGT CGCTGCTGTG 
TTGGCGGTGC TTTGGTATCC GGCCTCCGCA GGATCGGCCG AAAAGTGA

Protein sequence

MSGVSTPRIP AADAPFASPD TPARRQAILA VMVGCAALVF GLGASLNLAV GRIATSPLHP 
SATAVLWIVD TYLVVFGCLL IPAGAIGDRY GRKQAMLAGL TFLAVGSLLS AVAATVPVLL 
AGRAVAGAGA ALILPNSLAL VVQVYPADQK SHAIAVWTGM TGLGGALGNI LGGLVLQFAE 
WQAIFTVAVP LALAGLALTA WLAPRQAGHE HPLDLVGAGI LMLSIFALLT GLIEGQELGW 
ASTEVIGALC AAAALLAVFL TTAARRKHPL VDPRIFRARG LCAGMLGITA SFIAMYSLFY 
LNGQYLMSVK GYPPALAGIC TLPLVVVLFW LSPRSVQLAR RFGARPVVAV GLAMLIVGLG 
LLRLCGADTS YWFYAASIGV IGIGSALSNP VLSTAIIGAL PPHQAGVGSG INSFTREIGG 
ALGVALFGSL LGSSFPSRLP DTLAQAHGAV QRSVGAALAY AESLPGTAAN QTVQVVRQAF 
SGAMAQSLLT VMLVLAVAAV LAVLWYPASA GSAEK