Gene Rcas_3462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3462
Symbol
ID	5540961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4521823
End bp	4523061
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	64%
IMG OID	640895580
Product	major facilitator transporter
Protein accession	YP_001433530
Protein GI	156743401
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0107746
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGCT GGCAACGTAC CCTCTTCATT CTGGTCGCTG CGCAACTGGT ATCGGCTATC 
GGTTTCGGGA TGTTCTTCCC GTTCCTGCCG CTCTACGTCG AGCAACTGGG AACAAACACC 
GGCTTGAGTC TTGAGTTCTG GGCCGGTATG GTCTTCTCCG GTCAGGCGCT CACCATGGCG 
ATCACGTCGC CGATCTGGGG ATCGCTGGCG GATCGCTATG GTCGCAAGGC GATGATCGAA 
CGCGCCATGT ACGGCGGCGC GGCGATCATT CTGTTGATGG GATTCGCTCG CTCGGCGGAA 
GAACTGGCGC TGTTGCGCAC GATCCAGGGC GCGATCACCG GCACGATTGC GGCGATCAAC 
GCGCTTGCTG CTTCGCTCGT GCCACGTGAG CGCACCGGCT ACGCCATGGG GATGTTGCAG 
GTTGGGCTAT GGGCTGGCAT TGCCGCTGGA CCATTGCTCG GCGGGATCGT TGCCGATGCG 
TTTGGCTTTC GCGCGGCGTT TCTTGTCACA TCGGTCCTGC TGCTCATCTC CGGCGTCGTC 
GTTACGTTTG GCGTCCAGGA GCACTTCACG TCGCCGCCGA AAGGCGTGAA GCGACCCGGC 
ATCCTCAACG ATTGGCGGCG CATCCTGGCG CTGCCAGCCG TCCCTGCCGC TTATGCGACG 
CGCTTCCTCA ACTGGCTGGG ACCGAACATG CTGTTGCCGA TGCTGCCGCT CTACGTCGCG 
TCGCTCATGC GCGGCGGTGC AGGGGTCAGC ACCCTGACCG GTGTGATTGT CGGGCTTTCA 
TCGGCTGCTG GCACGGTCAG CGCACTCTAT CTGGGGCGCC TGGGCGACCG TATCGGGCAT 
CGGCGGGTAT TGCTCGCGGG CACGCTGGTT GCGGCGCTTT GCTTTGTTCC GCAGGCGTTC 
GTCACTGCCG GATGGCAGTT GCTCATCCTT CAAGCGTTGA CCGGAGCGGC GACCGGCGGG 
ATGAATCCGG CGCTCAGTGC GTTGCTGGCG CGCTACACCA ACGAAGGAGA CGAAGGAGCA 
GTGTTTGGCA TTGACAACTC CGTGAATTCT GCTGCGCGCG CCGCCGCGCC CTTGTGCGGC 
GCCATGATCG CCGCATGGTT CGGATTGCCT GCCATCTTCA TCGCAACAGC CCTGGTGCTG 
CTGGGCGCGG CGGCGCTGGT CTTCCGCCGC CTGCCGGAGC GAACGGTTGC GTCGTCGGTT 
GTGTCGGCAG TTCAGCCATG CGAGCACACG CAGAGGTGA

Protein sequence

MTRWQRTLFI LVAAQLVSAI GFGMFFPFLP LYVEQLGTNT GLSLEFWAGM VFSGQALTMA 
ITSPIWGSLA DRYGRKAMIE RAMYGGAAII LLMGFARSAE ELALLRTIQG AITGTIAAIN 
ALAASLVPRE RTGYAMGMLQ VGLWAGIAAG PLLGGIVADA FGFRAAFLVT SVLLLISGVV 
VTFGVQEHFT SPPKGVKRPG ILNDWRRILA LPAVPAAYAT RFLNWLGPNM LLPMLPLYVA 
SLMRGGAGVS TLTGVIVGLS SAAGTVSALY LGRLGDRIGH RRVLLAGTLV AALCFVPQAF 
VTAGWQLLIL QALTGAATGG MNPALSALLA RYTNEGDEGA VFGIDNSVNS AARAAAPLCG 
AMIAAWFGLP AIFIATALVL LGAAALVFRR LPERTVASSV VSAVQPCEHT QR