Gene Rcas_4096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4096
Symbol
ID	5541607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5310218
End bp	5311468
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	61%
IMG OID	640896208
Product	major facilitator transporter
Protein accession	YP_001434146
Protein GI	156744017
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.25734
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.218815
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCTCT GCCAGGATAC CGACAAACAT CTCATGAAAC GCAACGCGCT TGCCATTCTT 
TTTCTTGCGG TCTTCGTCGA TCTGGTCGGC TACGGCATGA TCGTGCCGCT GTTGCCGTTC 
TATGTGCAGC GCGTCGCTCC CGGCGCCACA CTGGTCGGCA TACTGAGCGG GTTCTATGCT 
ATGGCGCAGT TTCTCGTCGG TCCAATGCTG GGGAGTCTGT CGGATCGGTT TGGTCGCCGC 
CCGGTGCTGA TTGCTTGCCT GAGTGGCACG TCGCTCGCGT ACCTGCTCCT GGCGATTGCC 
GACAGTCTGC CGCTGTTGGT ACTGGCGCTG TTCATCGATG GGGTCACCGG CGGCAATCTC 
AGCATCGCCC AGGCGTCGAT CGCCGACAGC ACCACGCCGG ATCGCCGTGC ACGCGGTCTG 
GGTCTGATCG GAGCGGCATT TGGATTGGGA CTGATGGTTG GTCCTGTGAT AGGCGGGGTG 
CTGAGCCTGA CCAACCTGAG CGCCCCGGCG CTGGTCGCTT CGATGCTGGC GTTTGCGAAC 
ACCCTGTTTG CGCTTGCCGC GCTCCCCGAA TCGCTACCGC CGGAACGCCG CCGATTAATC 
CCTCTCGATA GCGCGAAGCC ATCGCACTGG AGCATGGTGC TGCGCGTTGC AAACCCACTG 
GCGAACCTGA TTGTCCTGCT GCGAATTGTG ACGATCCGTC GCGTGTTGAT GGTCGTAGTG 
TTGCTGAACC TCGCATTCTC AGGGCTGTAC AGTAACTTCC CGCTCTTTAC CGCCGCGCGC 
TTTGGCTGGG GTATGTTCGA GAATGCGCTA TTCTTTGCGT TTGTGGGTAT CTGCGCAGTG 
ACCACACAGG GATTGCTGCT CGGTCGCATG CAGCGCTGGC TGGGAGACGC GCGACTGGCG 
CGTGTTGGAA TGATCGTGAT GGTATGCGCC CTGCTCGCAA CCGGTCTGGC GTCAGCGGCA 
TGGATGCTCT ATCCATCAGT GGGATTGATC GCGTTTGGCA GCGGTCTGGC AATCCCGGCA 
CTCACGAGCC TGCTCTCGCT CCAGGTATCG CCCGCCGACC AGGGGCGCCT GATGGGAGGA 
ACGGCAGCAC TGCTCAACCT GACGATGATC GCCGGTCCAG TGGTGGCGGG GATCAGTTTT 
GATCGGGCGG GAACGGCGGC GCCATATCTC ATCGGAGCGT TGCTGGGAAG TGCGGCGTTG 
TTGATATTCG CCTCGCCAAC GATCATTCCT CGTCAGGAGG CAACGTCGTG A

Protein sequence

MILCQDTDKH LMKRNALAIL FLAVFVDLVG YGMIVPLLPF YVQRVAPGAT LVGILSGFYA 
MAQFLVGPML GSLSDRFGRR PVLIACLSGT SLAYLLLAIA DSLPLLVLAL FIDGVTGGNL 
SIAQASIADS TTPDRRARGL GLIGAAFGLG LMVGPVIGGV LSLTNLSAPA LVASMLAFAN 
TLFALAALPE SLPPERRRLI PLDSAKPSHW SMVLRVANPL ANLIVLLRIV TIRRVLMVVV 
LLNLAFSGLY SNFPLFTAAR FGWGMFENAL FFAFVGICAV TTQGLLLGRM QRWLGDARLA 
RVGMIVMVCA LLATGLASAA WMLYPSVGLI AFGSGLAIPA LTSLLSLQVS PADQGRLMGG 
TAALLNLTMI AGPVVAGISF DRAGTAAPYL IGALLGSAAL LIFASPTIIP RQEATS