Gene Rcas_0744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0744
Symbol
ID	5538210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	973900
End bp	975126
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	62%
IMG OID	640892900
Product	major facilitator transporter
Protein accession	YP_001430883
Protein GI	156740754
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.871557
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGACG CACAGATTTC GGTGACGCTT TCTCCGGTGC AACGGCGCCA CGGCGCGATG 
GTGATGCTCG TCATCACATT TCTGATGTGG GGTGGATTCT TCATGGTCAT TCCCCTTCTG 
TCCCTACGGT ATGTTGATGA TCTGGGATGG TCGGCGGGCG CCGTGGGGTT GGTGCTGGCG 
ATCCGGCAGT TGACGCAACA GGGGTTGACC GTCTTTGGTG GTGCGCTGGC AGATCGGTTC 
GGTGCGAAGG AGTTAATCGT CGTCGGGATG CTCATTCGTG CAATAAGTTT CAGCGCGATG 
GCGGTTGCGA CGACGTATCC CTTCCTGATG ATCAGCGCCA TTCTGGCGGC GCTTGGCGGC 
GCCTTGTTCG ATTCGCCTTC GTCGGCGGCG ATGGTGGCGC TGACGCGCCC CGAAGAGCGC 
AATCGCTACT TTGCCGTGTT GGGCATTGTG CGCGGGCTGG GAATGTCGCT CGGTCCGCTG 
GTGGGCGCAG CGCTTTTGCG GGTTGATTTT GCCTTTGTTG CGCTTGCGGC TGGCGGGTGT 
TTCTTTGTTG CTTCTGGAAT CACCTTCCTG TTGTTGCCGC CGGTGCGGGT TGCCGCCGAG 
CGCAGCGAGT TGCTGGCGGG CATTCTGATG GCGCTGCGCG ACCGACGATT CATGGCGTTC 
AACGTTCTGT TGATGGGATA CTGGTTTATG TGGGTGCAGT TGACCATCTC GCTCCCTCTG 
GCAGCGCGGG CGCTGGCGGG AACTTCCGAT GCGGTCAGCT GGCTCTATGC GCTGAATGCG 
GGTATGAGCG TGCTTTTGCA GTATCCGGTT GTGCGCCTGG CGGAACGCTG GTTGCGCCCG 
CTTCCCGTGC TGATGTTTGG CATCGTGTTG ATGGCGCTAG GGTTAGGAAG TGTTGTGTTT 
GCCGGCGCCA TTGGCGCGCT GCTGGTGAGT GTGGCGCTCT TCTCGTTCGG CGCGCTGCTG 
GCGGCGCCTG GACAACAGAC GGTTGCCGCC GATCTGGCGA ACCCGGCAGC GCTCGGATCG 
TACTTCGGCG TCAGTGCGCT GGCGCTGGCG CTTGGTGGCG GCATCGGCAA TTATGCGGGA 
GGGGCGCTCT ATAGTTTGGG CCACGACATC AACTTCCCTG CGCTACCCTG GCTGGTTTGC 
CTGGGAGTGG GCATCGGTTC GGCAGCCGGG CTTGCGGCGC TCGACCGGCG CCTTGTACGG 
CGGGCAGAGT CAGGGGTTAG GGGTTAG

Protein sequence

MTDAQISVTL SPVQRRHGAM VMLVITFLMW GGFFMVIPLL SLRYVDDLGW SAGAVGLVLA 
IRQLTQQGLT VFGGALADRF GAKELIVVGM LIRAISFSAM AVATTYPFLM ISAILAALGG 
ALFDSPSSAA MVALTRPEER NRYFAVLGIV RGLGMSLGPL VGAALLRVDF AFVALAAGGC 
FFVASGITFL LLPPVRVAAE RSELLAGILM ALRDRRFMAF NVLLMGYWFM WVQLTISLPL 
AARALAGTSD AVSWLYALNA GMSVLLQYPV VRLAERWLRP LPVLMFGIVL MALGLGSVVF 
AGAIGALLVS VALFSFGALL AAPGQQTVAA DLANPAALGS YFGVSALALA LGGGIGNYAG 
GALYSLGHDI NFPALPWLVC LGVGIGSAAG LAALDRRLVR RAESGVRG