Gene RoseRS_4478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4478
Symbol
ID	5211463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	5615401
End bp	5616687
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	60%
IMG OID	640598057
Product	major facilitator transporter
Protein accession	YP_001278760
Protein GI	148658555
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000434229
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000716178
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAACCTGC GTTCGCCAAA ACTCTTTTTG TTCCTGACCG TCTTGATCGA TCTGCTCGGT 
ATCGGCATTG TGTTGCCGCT GATGCCGTAC TATCTCAAGA TCGTCGAGCA GTCGAGCATT 
CCATGGCTGG CAGCCAATCG CGCGATCATC GTCGGCGCAT TGATGGCGTC CTTTGCGCTG 
ATGCAGTTTC TCTTCACACC GGTGCTCGGC GCTCTGTCCG ACCGGTATGG GCGCCGACCG 
ATCCTGCTCA TCAGCGTCCT GGGCAGCGGG CTGTCGTATG TGCTGTTCGG GTTTGCCGAA 
TACCTGTCGT TTCTTGGGGT CGAAACAGTC CTGGCAATCC TGTTTATCGG TCGGATGCTG 
AGCGGAATTA CCGGCGCAAG TATTTCGACT GCGCAGGCAT ACATTGCCGA CACGACCACC 
CCCGAAGAGC GCACGAAGGG CATGGGCATG ATCGGCGCAG CATTCGGTCT GGGTTTCATG 
CTCGGTCCGG CGCTCGGCGG ATTGTTGAGC ACAATCAGCC TGGAAGCGCC AGCATTCGTT 
GCCGCCGGTC TTGCATTCGC AAATGTGATC TTTGGTTACT TCAAGTTGCC GGAGTCGCTG 
CCGCCTGAGC GACGCATGGT CACGCCGATG CGTGGGATGA ATCCGGTGTC GCGCCTGAGC 
GCGCTGTTGC GGCGATCCAG CATTCGTCCG CTGCTGATCG GCATCTTCCT GCTCAATATG 
GCATTTTCCG GCTTGCAGAG CAACTTTGCC GTGTTCAGCG ATGTGCGCTT CGGTTTCGGT 
CCGCTCGATA ATGCGCTGAT CTTCACGCTG GTCGGGTTGC TGGCGGTGGT GATGCAGGGT 
TTTCTGATCC GCCGTTTGGT GCTTGCCTTT GGTGAGACGC GACTGGCAAT CGCTGGCATG 
ACGATGATGG CAGGCGCATT CATTGCGGTC GCCCTGGCGC CGGAGGCATG GATGCTCTTC 
CCGGCGGTTG GCGCCATCGC TATTGGTGAT GGAATGGCAA CACCGGCGTT GACCGGTCTG 
ATCTCGCGGC GGGTGGACGC GCACGAGCAG GGAGCGACGC TGGGCGGGAC GCAGGGGCTG 
ATCAGCCTGA CGCGGATCGC TGCGCCGATC CTGGCAGGTA CGACGTTCGA TCTGATCAAC 
GTGAGTGCGC CATATTACCT GGGCGGCGCG CTGATCGCCG TGGCCGTCGC AGTTGTCGGT 
TCGGCGTTGT TGCCAGCATT GCGGAGCGGC GTTGGTCATG ATCAGCCGCA GGGTGCGGTG 
ATGATCGGAA GCGCAAAAGC GGAATGA

Protein sequence

MNLRSPKLFL FLTVLIDLLG IGIVLPLMPY YLKIVEQSSI PWLAANRAII VGALMASFAL 
MQFLFTPVLG ALSDRYGRRP ILLISVLGSG LSYVLFGFAE YLSFLGVETV LAILFIGRML 
SGITGASIST AQAYIADTTT PEERTKGMGM IGAAFGLGFM LGPALGGLLS TISLEAPAFV 
AAGLAFANVI FGYFKLPESL PPERRMVTPM RGMNPVSRLS ALLRRSSIRP LLIGIFLLNM 
AFSGLQSNFA VFSDVRFGFG PLDNALIFTL VGLLAVVMQG FLIRRLVLAF GETRLAIAGM 
TMMAGAFIAV ALAPEAWMLF PAVGAIAIGD GMATPALTGL ISRRVDAHEQ GATLGGTQGL 
ISLTRIAAPI LAGTTFDLIN VSAPYYLGGA LIAVAVAVVG SALLPALRSG VGHDQPQGAV 
MIGSAKAE