Gene Csal_0500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0500
Symbol
ID	4026870
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	549562
End bp	550899
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	64%
IMG OID	637965659
Product	sugar transporter
Protein accession	YP_572561
Protein GI	92112633
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00879] MFS transporter, sugar porter (SP) family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.615232
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAACA TCCTCAAATG GTCGCTCTTT GTGGCCATGG CCGGCTTCCT GTTCGGCTTC 
GATACCGCCG TCATCTCCGG CGCGGACAAA CCCATCCAGA CGCTCTGGGG CCTCAGCGAC 
CTGCAGCATG GCCTGTTCAT CATGTCGATG GCTCTGTGGG GGACGGTGAT CGGGGCCCTC 
TTCGGCAACT GGCCGACCGA CCGGCTGGGG CGACGCCCCA CCCTGCTGAT CATCGGCGTG 
CTGTACCTGG TGTCGGCCAT CGGCTCGGCG CTGGCGACCG ACCCTCTTTG GTTCTCGGCC 
TTCCGGTTGA TCGGCGGCTT CGGCGTGGGC ATGTCGACCG TCGCCGCTCC CGCCTACATT 
TCCGAGATCG CGCCCGCCGA TCGACGCGGC CAGCTCGTCG CCCTGTACCA ATTCAACGTG 
GTGTTCGGCA TCTTCATGGC CTATGTCTCC AATGCCACCC TCGGGGCCCT GCTGGACGCC 
GACGCCTGGC GCTGGATGGT GGGTATCGAG GCGCTGCCCG CGCTCGTCTA CACCCTGCTG 
GTCTTCCTGG TGCCACGCAG TCCACGCTGG CTGGTCCTCA ACCGCAACGA CGACGTCGCT 
GCGGCCCATG TGCTGCGACA GATCGATCCC GAGGTCGATA CCGACCGGCA GATCGCCGAG 
ATCCGCAGCG CCGATGAGCG CGACCAGCAG GCTCGCAGCC GGTTCTTCTC GAAGCGTTAT 
CGACTGCCTA TCCTGCTGGC CTTCCTGATG GCGTTCTTCA ACCAGTTCAC CGGCATCAAC 
TTCGTGCTGT ACTACGCGCC CCGCATCCTC GAATCCGCCG AGCTGGGCAG CAACGCGGCA 
CTGTTATCGA CCGCCGGCAT CGGTCTGATC ATGGTGCTTT TCACCATGCT GGGCATCGCC 
CTGATCGACC GCCTGGGCAG GCGTACGTTG ATGTACATAG GCTCGGCGGG CTACCTGGTC 
TCGCTGTCGA TCATTTCGCA TGCCTTCTTC ACCGACGACC TGGGCGGGGC ACTGATTCCC 
TTGCAGCTTT GCGTGTTCGT GGCCGCCCAC GGTATCAGCC AGGGCACCGT CATCTGGGTC 
TTCATTTCGG AAATCTTCCC CAACCGGGAA CGCGCGCGAG GCCAGTCGCT GGGCAGCTTC 
ACCCACTGGT TCTTCGCCGC CGCCATCACC CTGGTCACCC CTTGGGTGCT GGGCGCCTTC 
AGTGGCGGTC CGGTCTTCGC TTTCTTCGCG GTGATGATGG TCCTGCAGGT ACTGTTCGTG 
GCCTTGTTGA TGCCCGAGAC CAAGGGCGTA TCGCTGGAGG ACATTCAAAA GCGCCTGACC 
GCCGGGACAG CGTCCTGA

Protein sequence

MSNILKWSLF VAMAGFLFGF DTAVISGADK PIQTLWGLSD LQHGLFIMSM ALWGTVIGAL 
FGNWPTDRLG RRPTLLIIGV LYLVSAIGSA LATDPLWFSA FRLIGGFGVG MSTVAAPAYI 
SEIAPADRRG QLVALYQFNV VFGIFMAYVS NATLGALLDA DAWRWMVGIE ALPALVYTLL 
VFLVPRSPRW LVLNRNDDVA AAHVLRQIDP EVDTDRQIAE IRSADERDQQ ARSRFFSKRY 
RLPILLAFLM AFFNQFTGIN FVLYYAPRIL ESAELGSNAA LLSTAGIGLI MVLFTMLGIA 
LIDRLGRRTL MYIGSAGYLV SLSIISHAFF TDDLGGALIP LQLCVFVAAH GISQGTVIWV 
FISEIFPNRE RARGQSLGSF THWFFAAAIT LVTPWVLGAF SGGPVFAFFA VMMVLQVLFV 
ALLMPETKGV SLEDIQKRLT AGTAS