Gene Rcas_4328 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4328
Symbol
ID	5541841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5580887
End bp	5582179
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	61%
IMG OID	640896434
Product	major facilitator transporter
Protein accession	YP_001434370
Protein GI	156744241
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTACGA TTGATCGCTC ACAGGCTTCC TGGAAATATC CTTTTGCGCT GATCTGGATT 
GGTCAGGCGT TCTCACTCTT CGGCAGCGGG CTGGCTGGCT TTGCTATCGT CTGGTGGCTG 
ACGGCCACTA CCGGCTCTGC CACGGTCCTT GCGACCGCAA CACTCGCCAC GCTTTTGCCG 
GGCATTCTGA TCGGACCGCT CGCCGGAGCG CTGATCGACC GCTGGGATCG ACGCGCAGTC 
ATTATGGTCG CCGATCTGAC CGGCGCGCTT GGAGCGGCTG CGCTCGCCGT CCTGTTCTGG 
ATCGACGCAC TCGCCATCTG GCATGTCTAC CTGATTATGG CGTTGCGGTC GCTGGCGGGC 
GCGTTCCATT GGCCCGCAAT GCAGGCATCG ATATCGCTCA TGGCGCCCGA ACGCCATCTG 
GCGCGCATTG GCGGACTGAG TCAGATGCTT CAGGGGGCAA CCAATATTGC TGCACCGCCG 
CTTGGAGCGT TGCTGATTGC GATCTGGCCC CTGCATGGTC TGATGTTGAT TGATGTTGTG 
ACGGCGCTCA TCGCAGTGGC AGGCGTCGGT CTGGTGCGTT TCCCGCGCCC GCCGCGAGCC 
GCGCCTGCTG TCGCTGATGC GCCTGCAACC GGTGTTGTGG CGGAGATGCG CGCCGGACTA 
CGGTATATCT CTCGCTGGCC CGGATTGATG ATGGTCATGG GCATGGCGGC ATTGATCAAT 
CTGCTCCTGA CTCCGGCGTT CTCGCTGTTG CCGATCCTGG TAACCAGGCA CTTTCATGGC 
GAGGCGCTCC ATCTTGCCTG GATGAACGCT GCCGAAGGCG CAGGCATCGT TCTTGGCGGA 
CTGATCATCG GCGTATGGGG CGGATTCAGG CGTCGTATGA ATACTGTTGT GTTTGGGCTG 
ATTGGGTTAG GCATCAGCAT TCTGGCAATC GGCGCTGCAC CGGCAACCGC TTTCTTGCCT 
GCACTCGCCG CAGTAGCAGT GGTCGGCGCT ATGTCGCCGG TGGTCAATGC CCCAATGATG 
GCAATTGTGC AGTCAGTCGT GGCGCCAGAA ATGCAAGGGC GTGTCTTCAC GGCATTGGGG 
AGTGTGTCGA TGGCAATGAC CCCGCTGGGG CTGGTGATTG CCGGTCCGGT CGCTGATGCG 
TTTGGGGTGC AGGTCTGGTA TCTGCTTGGC GGCTGCGCCT GCCTGCTTAT GACCCTTCTG 
GTTCTTGGCA TTCCCGCCGT GCGCGATCTG GAGGATCGTC CGCGCGACAG CGGGAGAAGT 
GCGGTGGTCA GATCAGAGAA TGTTCCATCT TGA

Protein sequence

MFTIDRSQAS WKYPFALIWI GQAFSLFGSG LAGFAIVWWL TATTGSATVL ATATLATLLP 
GILIGPLAGA LIDRWDRRAV IMVADLTGAL GAAALAVLFW IDALAIWHVY LIMALRSLAG 
AFHWPAMQAS ISLMAPERHL ARIGGLSQML QGATNIAAPP LGALLIAIWP LHGLMLIDVV 
TALIAVAGVG LVRFPRPPRA APAVADAPAT GVVAEMRAGL RYISRWPGLM MVMGMAALIN 
LLLTPAFSLL PILVTRHFHG EALHLAWMNA AEGAGIVLGG LIIGVWGGFR RRMNTVVFGL 
IGLGISILAI GAAPATAFLP ALAAVAVVGA MSPVVNAPMM AIVQSVVAPE MQGRVFTALG 
SVSMAMTPLG LVIAGPVADA FGVQVWYLLG GCACLLMTLL VLGIPAVRDL EDRPRDSGRS 
AVVRSENVPS