Gene Rcas_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1041
Symbol
ID	5538507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1357692
End bp	1358978
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	67%
IMG OID	640893178
Product	major facilitator transporter
Protein accession	YP_001431161
Protein GI	156741032
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTGGC TGTACGGCGA AATGGCTTCC GCGATGCCCA AACCACGACT ATCCATCTGG 
CGTCATCGTG ATTTTCTCCT TCTCTGGAGC GCCACGGCGG TCAGTCAATT GGGGACGCAG 
ATCACCTTCC TCGCTCTGCC GTTCATTGCC GTCACTCTGC TGGACGCCTC GCCGCTGGAC 
ACCAGCATCC TGGCAATGCT CGGATGGGCG CCGATGATTA CGCTTGGACT GGTCGCCGGC 
GCCATTGTGG ACCGTATGCG CCGCCAGCCG CTCCTCATTG GGTGTGATGT GGCGCGGGCG 
CTGGCGGTCG CCGCCATTCC CATCACGTAC CTAGCCGGCT GGCTCTCTCT CTGGCATCTC 
TATGCGACCG TCCTGATCAC CGGGCTGTTC AGCACGTTGT TCGACCTGGC CTATCAGGCG 
CGGCTGCCGA CCCTGGTTGC GCGCGACGAC CTGATCGCCG CCAATAGCGG GCTGGAACTG 
GCGCAGTCCG GCACACGCAT CATCGGTCCC GGACTGACCG GCGCGCTGAT CGCCGTCTTC 
ACTGCGCCGG TGGCGATCTT GTTCGATGCA CTGAGCTATC TGGCGTCGGC GCTGCTCCTC 
CTGGGAATCC GCCAGCCGGA ACCGCCGCTC GTCGCGGCGC CCCGCGCGGG ATCGGTGACA 
CACGTGCTAC GCCGGGAGAT GCGTGAAGGC ATGGTCAGTC TCTGGCGTCA ACCGTTGCTG 
CGCACGCTGC TCGGCGCCAC ATTGGGCTTG AGCATCGGCT GGGCGCTGGT GGAGGGAATT 
CTCATGTTCT ACATCGTGCG CACGCTAGCG CTGCCAGCGG AGGCGGCTGG CGCGGTCTTC 
AGCATTGGAA ACATCGGGTT GCTGATCGCC GCCGCCCTCG CCAGCCAGGT GACGCGACGC 
TGGGGCTTGG GTCCGGTCAT TGTCGGCGCG GCCGGGTTGC AGACGCTCGG ACTAGCGTTG 
CTGGCGCTGG CGCCGCTGGC GCCGCTGGCA CTGCTCACCA CCGGGTATCT GATGCGGGCC 
GCAGGAGTCG TGCTGTACAA CCTGAGCCAT CTGACCCTGC GCCAAAGCAT CACGCCGCTG 
CACCTGCTGG GACGGGTGAG CGCCGCTGTG CGCGTCCTGG GGTGGGCTAG CATTCCGGTC 
GGGCTGGTCG CTGGCGGCTG GCTGGCGACG CTGAGCGGGC CGTCAGTCGC AATCTGGAGC 
GGCGCCGCGT TCAGCGCGCT GGCGCTTGTG CCGCTGGCGC TAGGGCGGAT CTGGCAGGTG 
CGCACTGCGC CAGCCCCCGC CCCCTGA

Protein sequence

MHWLYGEMAS AMPKPRLSIW RHRDFLLLWS ATAVSQLGTQ ITFLALPFIA VTLLDASPLD 
TSILAMLGWA PMITLGLVAG AIVDRMRRQP LLIGCDVARA LAVAAIPITY LAGWLSLWHL 
YATVLITGLF STLFDLAYQA RLPTLVARDD LIAANSGLEL AQSGTRIIGP GLTGALIAVF 
TAPVAILFDA LSYLASALLL LGIRQPEPPL VAAPRAGSVT HVLRREMREG MVSLWRQPLL 
RTLLGATLGL SIGWALVEGI LMFYIVRTLA LPAEAAGAVF SIGNIGLLIA AALASQVTRR 
WGLGPVIVGA AGLQTLGLAL LALAPLAPLA LLTTGYLMRA AGVVLYNLSH LTLRQSITPL 
HLLGRVSAAV RVLGWASIPV GLVAGGWLAT LSGPSVAIWS GAAFSALALV PLALGRIWQV 
RTAPAPAP