Gene Rcas_3626 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3626
Symbol
ID	5541128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4735169
End bp	4736410
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	63%
IMG OID	640895746
Product	major facilitator transporter
Protein accession	YP_001433693
Protein GI	156743564
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.348332
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATCA CACCGTCGCA GCGTAGCGCG TTTGCCGCAA GGACATTCGC AGCGTTACGG 
CATCGTAATT ATCGCCTCTG GTTCTTCGGG CAGATGGTAT CGCTCTTCGG CTCCTGGATG 
CAAACCACTG CTCAGGGATT TCTGGTCTTT CAACTGACCG GTTCGCCCGC GTACCTGGGG 
TATGTCGGGT TCGCCGCCGG CATTCCTGCG TGGGCGCTGA CTCTCTATGG CGGCGTGGTC 
GCCGATCGTA TGCCGCGCCG AACTCTGCTG ATCATCACGC AGACGGCGCA GATGGCGCTG 
GCATTCGCGC TGGCGGCGCT CGTGTTCAGC GGTATCGTCC AACCCTGGCA TATTGTCGCA 
CTCTCGTTCC TGCTAGGGAT CGCCAATGCG TTCGACGCTC CGGCGCGCCT GGCATTCGTG 
CGTGAACTGG TGGACAAGGA AGACCTGACG AATGGCATTG CGCTCAACGC GACGATGTTC 
AACCTGGCGA CGACGACCGG ACCGGCGATG GCGGGGGTGA CCTACACTCT GGTGGGACCG 
GCGTGGTGTT TCATGCTGAA CGGCATCTCG TTCCTGGCGG TCATTGGCGC GCTCTGGCGC 
ATGCGGATGG CGCCGCAGCC GGTTGCGCCA CGCAGCGCCT CGGCGTGGCG CGACCTGCGC 
GAGGGGTTGA GTTACATCCT GCACGAACCG GTGGTGCGCA CGCTGATTGC GCTGGTGGGG 
GCGACGAGTT GTTTTGGCAT CTCGTTTGCG ACCCTCTTCC CGGCATGGGC GGTGCGCATT 
CTGGGGGGCG ACGCCGCCAC AACCGGTCTC TTGCAATCGG CGCGCGGTCT GGGAGCGCTG 
CTGGGAGCGT TGCTGATTGC GTCACTGGGG CGCTTTCAGT TCAAAGGGCG TCTATTGACA 
GTCGGCACAT TTGCGTTCCC AACACTGCTC ATTGTGCTGA CCTTCACGAC CTGGCTGCCG 
CTGACCCTGG TGCTCCTGAC GGCTTCGGGG CTGGCGGTGA TCCTGATCAT GAACCTGGCA 
AATGCGCTGG TGCAGACGCT GACACCCGAT GCGCTGCGGG GTCGGGTGAT GGCGGTCTAC 
AGCATGGTCT TTTTCGGAAT GATGCCAATC GGTGCGCTCT GGATCGGGGT GATCGCCGAG 
CGAGCCGGTG AACCGACGGC AGTGATCAGC GGGGCGCTGG TGGTCCTGGG AGTCGCAGCG 
CTCATACGTT TGGCTGTGCC GCAGATACGG AAGTTGACGT GA

Protein sequence

MTITPSQRSA FAARTFAALR HRNYRLWFFG QMVSLFGSWM QTTAQGFLVF QLTGSPAYLG 
YVGFAAGIPA WALTLYGGVV ADRMPRRTLL IITQTAQMAL AFALAALVFS GIVQPWHIVA 
LSFLLGIANA FDAPARLAFV RELVDKEDLT NGIALNATMF NLATTTGPAM AGVTYTLVGP 
AWCFMLNGIS FLAVIGALWR MRMAPQPVAP RSASAWRDLR EGLSYILHEP VVRTLIALVG 
ATSCFGISFA TLFPAWAVRI LGGDAATTGL LQSARGLGAL LGALLIASLG RFQFKGRLLT 
VGTFAFPTLL IVLTFTTWLP LTLVLLTASG LAVILIMNLA NALVQTLTPD ALRGRVMAVY 
SMVFFGMMPI GALWIGVIAE RAGEPTAVIS GALVVLGVAA LIRLAVPQIR KLT