Gene Rsph17025_1849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1849
Symbol
ID	5084910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	1890321
End bp	1891577
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	67%
IMG OID	640483408
Product	major facilitator transporter
Protein accession	YP_001168045
Protein GI	146277886
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.513333
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAAGG TCCTTGCCGC CACCTGGCCG CTTCTGCTGG GCGTCATGCT GCTGATGGTC 
GGCAACGGGG TCCAGGCCTC GCTGCTGGGC ATCCGCGGCG CGATCGAGGG ATTCTCGACC 
ACACAGCTGG CCGTCGTGAC CTCGGCCTAC TTCGCGGGAT TCCTCGTGGG CTCGCAGGTC 
GTGCCCGACC TGATCCGCCG GGTGGGCCAT GTGCGGGTCT TTGCGGCGCT CGGGTCGATG 
ATCTCGGCGG TGCTGGTGGT CTATCCGGTG ATGCCCGATT GGGCGGTCTG GACGCTGCTG 
CGGGTGCTGA TCGGTTTCAG CTTCTCGGGC GTCTACATCA CCGCCGAGAG CTGGCTGAAC 
AACACCGCGA CGAACGAGAC GCGGGGACAG GCGATGTCGG CCTACATGAT GGTGCAGATG 
GTGGGCATCA TCACGAGTCA GGCGCTGCTG AACGCGGCCG ATCCGTCGGG CTTCACCCTC 
TTCGTGATCC CCTCGGTGCT CGTGTCGCTG GCCTTCATGC CGATCCTTCT GACCGTGACG 
CCCACGCCGA CCTTCGAGAG CACCCGGAGG CTCTCGGTGC GCGAGCTGTT TCGCGTGTCG 
CCGCTGGGCA TCGTGGGGAT GCTGATGACC GGCGGGATCT TCTCGGCCAT GTTCGGCATG 
GCCTCGGTCT GGGGCACGCT CGAGGGACTC TCGGTGCAGG AGATCTCGAT CTTCATCGGC 
TCGATCTATG TCGGAGGCCT CGTGCTGCAA TATCCGATCG GCTGGGCCTC GGACCGGATG 
GACCGGCGTC AGCTGATCCT CGGGCTTGCC GTGGTGGCGG GGCTGCTGAT GGGGGTGACC 
GTCCTGTTCC AGCCGCCCTT CTGGGGGCTG ATCGCGGTCG CGCTGCTGCT CGGCGGGATC 
ACCAACCCCG TCTATTCGCT GCTGATCGCC TATACCAACG ATTTCCTCGG CAAGGAGGAC 
ATGGCGGCCG CCTCGGCGGG GCTCTTGTTC ATGAACGGGC TGGGGGCGGT CTGCGGGCCG 
CTCGTGACGG GCTGGATCAT GGAACAGGCG GGGCCGCGCG GCTTCTTTCT CTTCATCGGC 
CTGCTTTACG GGGCGATGGC GATCTATGCG GGCTGGCGGA TGACGCGGCG TGCGGCGCCC 
GCGGTGGCCG ACACGGGCTC CTTTGCATCC GTCGCGCCGA CCGCCTCGTC GGTGGCCGTC 
GGCGCCGTCA TGGAAGTGGT CACCGAGGCG CAGGAGGCGC AGCAGGCGGC CGAGTGA

Protein sequence

MFKVLAATWP LLLGVMLLMV GNGVQASLLG IRGAIEGFST TQLAVVTSAY FAGFLVGSQV 
VPDLIRRVGH VRVFAALGSM ISAVLVVYPV MPDWAVWTLL RVLIGFSFSG VYITAESWLN 
NTATNETRGQ AMSAYMMVQM VGIITSQALL NAADPSGFTL FVIPSVLVSL AFMPILLTVT 
PTPTFESTRR LSVRELFRVS PLGIVGMLMT GGIFSAMFGM ASVWGTLEGL SVQEISIFIG 
SIYVGGLVLQ YPIGWASDRM DRRQLILGLA VVAGLLMGVT VLFQPPFWGL IAVALLLGGI 
TNPVYSLLIA YTNDFLGKED MAAASAGLLF MNGLGAVCGP LVTGWIMEQA GPRGFFLFIG 
LLYGAMAIYA GWRMTRRAAP AVADTGSFAS VAPTASSVAV GAVMEVVTEA QEAQQAAE