Gene RoseRS_4401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4401
Symbol
ID	5211386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5518426
End bp	5519670
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	63%
IMG OID	640597981
Product	major facilitator transporter
Protein accession	YP_001278684
Protein GI	148658479
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.868968
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGACG CACGGAACCC GGTGCTCCTT CCACCTGCAC AGCGACGACG CGGCGCAGTG 
GTGATGCTGG TGATTACTTT CCTCATGTGG GGCGGATTCT TCATGGTTAT CCCCCTTATA 
TCGATACGCT ACGTTGATGA CCTGGGATGG TCGGCGGGAG CGATAGGACT GGTGCTGGCG 
ATCCGTCAGT TAACGCAGCA GGGATTGACC GTTTTCGGCG GCGCGCTGGC AGACCGGTTC 
GGCGCGAAGG GATTGATCGT CGTCGGCATG TTCATTCGTG CGGTCAGTTT CAGTGCGCTG 
GCGCTTGCGT CAACCTATCC GCTGCTGATG ATCAGCGCGC TCATGGCGGC GATTGGCGGC 
GCATTGTTCG ATTCGCCATC GTCGGCGGCG ATGGTTGCGC TTACGCGACC GGAAGAGCGC 
AACCGGTACT TTGCAGTGCT GGGAGTCGTG CGCAACCTGG GGATGTCCCT CGGTCCGCTG 
GCGGGCGCAG TGTTGCTACG GATCGATTTT GCCTTTGTTG CGCTTGCGGC GGCTGGCTGT 
TTCTTCATCG CTGCGGCTGT GACGTTGCTG CTCTTGCCGC CGGTGCAGGT TGCAACCGAA 
CGCGGTGAAC TGCTGGCGGG CATTCTGCTT GCGCTGCGCG ACCGGCGCTT CATGGCGTTC 
AATGTGCTGC TGATGGGATA CTGGTTCATG TGGGTGCAGA TGACCATCTC GCTTCCCCTG 
GCGGCGCGCA CGCTTGCCGG GACTGCTGAT GCCGTGAGCT GGCTCTACGC CCTGAATGCA 
GGAATGGGCA TCGTGTTGCA GTATCCGGTG GTGCGCATCG CCGAACGCTG GTTGCGCCCG 
CTCCCGGTGT TGCTGATCGG CATTGCGCTG ATGGCATTGG GGTTGGGCAG CGTGGCGCTT 
GCCAGTACGA CCGGGCTGCT GCTGGCGAGT GTGGCGATCT TTTCATTTGG CGCCTTGCTG 
GCTGCGCCGG GACAACAGAC GGTCGCTGCC GAACTGGCGA ATCCGACGGC GCTTGGCTCG 
TACTTCGGCG TCAGCGCACT GGCGCTGGCG CTGGGCGGCG GGATCGGGAA TTATGCCGGG 
GGGGCGTTGT ACAGCCTGGG ATACCACATT GGCGCACCAG CACTCCCCTG GCTGGTCTGT 
CTGGTGGTCG GCATCGGCTC GGCAATCGGT CTGGCGCTGC TCGATCGCCA CCTTACCCGT 
CATCCGGCGA ATGTTGCCGA TGCAGCCGTG TCCTATCGCG ACTGA

Protein sequence

MTDARNPVLL PPAQRRRGAV VMLVITFLMW GGFFMVIPLI SIRYVDDLGW SAGAIGLVLA 
IRQLTQQGLT VFGGALADRF GAKGLIVVGM FIRAVSFSAL ALASTYPLLM ISALMAAIGG 
ALFDSPSSAA MVALTRPEER NRYFAVLGVV RNLGMSLGPL AGAVLLRIDF AFVALAAAGC 
FFIAAAVTLL LLPPVQVATE RGELLAGILL ALRDRRFMAF NVLLMGYWFM WVQMTISLPL 
AARTLAGTAD AVSWLYALNA GMGIVLQYPV VRIAERWLRP LPVLLIGIAL MALGLGSVAL 
ASTTGLLLAS VAIFSFGALL AAPGQQTVAA ELANPTALGS YFGVSALALA LGGGIGNYAG 
GALYSLGYHI GAPALPWLVC LVVGIGSAIG LALLDRHLTR HPANVADAAV SYRD