Gene Rsph17029_1616 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1616
Symbol
ID	4897169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1701192
End bp	1702448
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	67%
IMG OID	640112207
Product	major facilitator transporter
Protein accession	YP_001043498
Protein GI	126462384
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0546554
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAAGG TCCTCGCCGC CACCTGGCCG CTGCTGCTGG GCGTCATGCT GCTGATGGTG 
GGCAATGGCG TGCAGGCCTC GCTTCTGGGC ATCCGCGGCG CTCTGGAAGG CTTTTCCACC 
ACGCAGCTCG CCATCGTGAC CTCGGCCTAT TTCGCAGGCT TCCTCGTGGG CTCTCAGGTG 
GCCCCCGACA TGATCCGCCG CGTGGGCCAT GTGCGCGTCT TTGCGGCGCT GGGGTCGATG 
ATATCGGCGG TGCTCGTGGT CTATCCGGTG CTGCCCGACT GGACGGCCTG GACGCTGCTG 
CGGGTGCTGA TCGGCTTCAG CTTCTCGGGC GTCTATATCA CGGCCGAAAG CTGGCTGAAC 
AACACCGCCA CCAACGAGAC CCGCGGGCAG GCGATGTCGG CCTACATGAT GGTGCAGATG 
GTGGGCATCA TCACCAGTCA GGCGCTGCTG AATGCGGCCG ATCCGTCCGG CTTCACGCTC 
TTCGTGATCC CTTCGGTGCT GGTGTCGCTG GCCTTCATGC CGATCCTGCT CACCGTCACG 
CCCACGCCGA CCTTCGAGAC GACGCGGCGG CTGTCGGTGC GCGACCTGTT CCGCGTGTCT 
CCCCTGGGCG TGGTGGGGAT GCTGATGACG GGCGGGATCT TCTCGGCCAT GTTCGGCATG 
GCCTCGGTCT GGGGCACGCT CGACGGGCTC TCGGTGCAGG AGATCTCGAT CTTCATCGGC 
TCGCTCTATG TGGGCGGGCT CGTGCTGCAA TATCCGATCG GCTGGGCCTC GGACCGAATG 
GACCGGCGCC AGCTGATCCT CGGGCTTGCG GTGGTGGCGG GGCTGCTCAT GGCCCTGACC 
GTGGCGCTGG CGCCGCCCTT CTGGGGGCTG ATCGGGGTCG CGCTGCTTCT GGGCGGGATC 
ACCAACCCGA TCTATTCGCT GCTCATCGCC CATACGAACG ATTTTCTGGG CAAGGAGGAT 
ATGGCGGCGG CCTCGGCCGC GCTCCTGTTC ATGAACGGGC TCGGCGCGAT CTGCGGCCCG 
CTGGTGACGG GCTGGATCAT GGAGCAGGCG GGGCCGAGCG GCTTCTTCCT CTTCATCGGC 
ATCCTCTATG GCGCGATGGC GGCCTATGCC GGATGGCGGA TGACGCGGCG CGCGGCGCCC 
GCGGTGGCCG ACACCGGCTC GTTCGCGACC GTGGCGCCCA CGGCCTCGTC GGTTGCGGTC 
GGAGCGGTCA TGGAAGTGGT GACCGAGGCG CAGGAGGCGC AGCAGGCGGC CGAGTGA

Protein sequence

MFKVLAATWP LLLGVMLLMV GNGVQASLLG IRGALEGFST TQLAIVTSAY FAGFLVGSQV 
APDMIRRVGH VRVFAALGSM ISAVLVVYPV LPDWTAWTLL RVLIGFSFSG VYITAESWLN 
NTATNETRGQ AMSAYMMVQM VGIITSQALL NAADPSGFTL FVIPSVLVSL AFMPILLTVT 
PTPTFETTRR LSVRDLFRVS PLGVVGMLMT GGIFSAMFGM ASVWGTLDGL SVQEISIFIG 
SLYVGGLVLQ YPIGWASDRM DRRQLILGLA VVAGLLMALT VALAPPFWGL IGVALLLGGI 
TNPIYSLLIA HTNDFLGKED MAAASAALLF MNGLGAICGP LVTGWIMEQA GPSGFFLFIG 
ILYGAMAAYA GWRMTRRAAP AVADTGSFAT VAPTASSVAV GAVMEVVTEA QEAQQAAE