Gene Rsph17029_1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1033
Symbol
ID	4895573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1066608
End bp	1067777
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	74%
IMG OID	640111620
Product	major facilitator transporter
Protein accession	YP_001042916
Protein GI	126461802
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.611435
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCAGCG CCTACCGCAA TGCCCTTCTC CTGAGCCTCG GGCCCGCCGC GGGGATCGGG 
CTCGGCCGCT TCGCCTATGC GCTGCTTCTG CCGGCGATGC AGGCCGACCT CGGCTGGAGC 
TATGCCGCGG CGGGCTGGAT CAACGCGGCC AATGCCGCGG GCTATCTCGG GGGCGCCATG 
CTCGCGCCTG CGCTGGCGCA GCGGGTGGGC GCGGCGCGCG CCTTCGCCGC CGGGCTGGCG 
ATGCTGCTGC CGGCGCTGGC CGCGGTGGCC CTGACGCGGG ACGTGGCGGC TCTGGCCGCG 
CTCCGCCTGC TGGCGGGCGG CTCGGGTGGG GTCGTCTTCG TCTGCGGCGG CCTCCTTGCC 
GTGGGCCTCA GCCTGCGGGC GGGGTCGGGC GGGCTCGTGC TCGGCACCTT CTACGCAGGC 
ACCGGGCTCG GGATGATCCT GTCGGCGCTG GCGGTGGCGC CCCTCCTCGG GATCGCGGGC 
GCCACCCACT GGCCGCAGGG CTGGCTGATC CTCGCGGGCC TCTCCGCCCT CTGCGCGGCG 
CTGGCGCTCC TGCCGCTCAG GGACGGGCTC GGCGCCTCCG TGCGGCAGGC CGGCAGCCGC 
GGCCCCACGC CTCTCCGCTT CTGGAGGATC CTCGCCGGCT ATCTCCTCTT CGGCCTGGGC 
TCCATCGGCT ACATGACCTT CATCTACGGC CACCTCGCCG AGAGCGCGGG CGGCTGGCCG 
CAGGCGATGC TCTTCTGGTG CGCTCTGGGT CTCGCGGCGG TGGCCGCGCC CTCGATCTGG 
CGGCGGCTGA TCGGCGGCGC GAGCCCCGAG CGCAGCTTCG CGCTCCTCGT GGCCACCAAT 
GCGCTAGGCT CGGTGCTGCC GTTCCTGATG CCGGGCGCGC TCGGCCTCTG GCTCTCGGCC 
TTCCTGTTCG GCAGCACCTT CTTCAGCACG GTGGCGGCCA CCAGCGCCTT CGCCAGCGCC 
CTGCCGCAGG CCTTCGATCG GGGCCGCGCG ATCCGCGCCT TCACCATCGC CTTCGCGCTG 
GGGCAGTTCG GAGGCCCGGT CGTCCTCGGC TGGACGGCCG ATCTCACCGG GCGTCTCGAT 
GCGCCGCTGA TGTTCGCAAG CCTCGTCGTG CTCGCAGGCG CGCTGCTGGG TGTTCTCGAG 
CGTCGGCCGG ACGCCATCGA CGGGGCATGA

Protein sequence

MTSAYRNALL LSLGPAAGIG LGRFAYALLL PAMQADLGWS YAAAGWINAA NAAGYLGGAM 
LAPALAQRVG AARAFAAGLA MLLPALAAVA LTRDVAALAA LRLLAGGSGG VVFVCGGLLA 
VGLSLRAGSG GLVLGTFYAG TGLGMILSAL AVAPLLGIAG ATHWPQGWLI LAGLSALCAA 
LALLPLRDGL GASVRQAGSR GPTPLRFWRI LAGYLLFGLG SIGYMTFIYG HLAESAGGWP 
QAMLFWCALG LAAVAAPSIW RRLIGGASPE RSFALLVATN ALGSVLPFLM PGALGLWLSA 
FLFGSTFFST VAATSAFASA LPQAFDRGRA IRAFTIAFAL GQFGGPVVLG WTADLTGRLD 
APLMFASLVV LAGALLGVLE RRPDAIDGA