Gene Rpal_5295 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5295
Symbol
ID	6412996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5712919
End bp	5714205
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	66%
IMG OID	642715184
Product	major facilitator superfamily MFS_1
Protein accession	YP_001994256
Protein GI	192293651
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCGCGC AGCCCACGCC GCAAGGTGCC TGGAGGATCA CCTTCCTGCT GTTTCTATTC 
ATGGTGGTCA ACTTCGCCGA CAAGATTGTC GTAGGCCTGG CCGGCGTGCC GATCATGCAG 
GAGCTGAAGC TCTCGCCCGA ACAATTCGGT CTGCTCGGCT CGTCGTTCTT CTTCCTGTTC 
TCGATCACCG CGATCGTGGT CGGCTTCATC GTCAATCGGG TTGAGACCAG ATGGGTGCTG 
TTGGCGCTGG CGCTGGTGTG GGCGGTGGCG CAGTTTCCGA TGGTCGGCGA GGTCTCCTTC 
GCCACCTTCG TGATCTGCCG CATCATTCTC GGCGCCGGCG AAGGGCCAGC GTTCTCGGTC 
GCAGCGCATG CGATCTACAA GTGGTTTCCG GATCATCAGC GCACGCTGCC GACCGCGATC 
CTGTCGCAGG GCTCGGCGTT CGGTGTGATC CTGGCGGTGC CGGCGCTGAA CTGGATCATC 
GTCAATCACT CCTGGCACTA CGCCTTCGCG GCGCTCGGCA TCGTCGGGCT GATGTGGGCG 
GTGGCGTGGC TCGCGCTCGG CAAAGAGGGG CCGCTGGTGC CGAGCCCCGC GGCGGCCGCC 
GCCGAGGTGC GGATTCCTTA CGTGCGGCTG CTGACCTCGC GCACTTTCAT TGGCTGCGTG 
CTGGCAACAT TCGGTGCCTA TTGGGCGCTG TCGCTCGGGC TGACCTGGTT TACCACCTTC 
ATCGTGCAGG GGCTGGGCTT CAGCCAGCAC CAGGCCGGGC TGGTCTCGAT CACGCCGTGG 
GTGTTCGGCG CCTGCGTGGT GCTGTTCACC GGCTGGCTGT CGCAGCGGCT GATGCAGCGC 
GGCGTCTCCA GCCGGATGGC GCGCGGCGTG CTCGGTGCGG CGCCACTCTT GGTCGGCGGC 
GCCATCATCC TGATGCTGCC CTATATCGAC AGTCCCACCG CACGGATCGT CGCCCTGGTG 
GTCGGCTCCG GCCTGTGCGG CTCGATCTAC GTGGTGTGTC CGCCGATGAT CGCCGAGTTC 
GCTCCGGTGT CGCAGCGCGG CGCCGCGATC GCGATCTACG GCGCGCTGTA TACGCTGGCG 
GGGATCATCG CACCGTGGGT GATGGGCAGC GTACTGCAGC ACTCAGCCTC GCTGCTTCAC 
GGTTACATCG TCGGCTACGC CATCAACGGC GCCGTGATGA TCGTTTCGGG TGTCGCCGGC 
CTGTTGCTGC TGTGGCCGAA CACCGAGCGG GCACGGCTGT TGCGGAGCGC GGAGCCGGTG 
TCACTGGGAC TGCGCAAGCC GGCCTAA

Protein sequence

MIAQPTPQGA WRITFLLFLF MVVNFADKIV VGLAGVPIMQ ELKLSPEQFG LLGSSFFFLF 
SITAIVVGFI VNRVETRWVL LALALVWAVA QFPMVGEVSF ATFVICRIIL GAGEGPAFSV 
AAHAIYKWFP DHQRTLPTAI LSQGSAFGVI LAVPALNWII VNHSWHYAFA ALGIVGLMWA 
VAWLALGKEG PLVPSPAAAA AEVRIPYVRL LTSRTFIGCV LATFGAYWAL SLGLTWFTTF 
IVQGLGFSQH QAGLVSITPW VFGACVVLFT GWLSQRLMQR GVSSRMARGV LGAAPLLVGG 
AIILMLPYID SPTARIVALV VGSGLCGSIY VVCPPMIAEF APVSQRGAAI AIYGALYTLA 
GIIAPWVMGS VLQHSASLLH GYIVGYAING AVMIVSGVAG LLLLWPNTER ARLLRSAEPV 
SLGLRKPA