Gene Csal_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0040
Symbol
ID	4026383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	48242
End bp	49426
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	71%
IMG OID	637965192
Product	major facilitator transporter
Protein accession	YP_572104
Protein GI	92112176
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCGCA CCGAATTCCG CCTGATCGTC GCCGGCACCA TGCTGATCGG CACCACCTAC 
GGCCTGGCAC GCTTCGCCTA CGGGCTGTTC CTGCCCAGCA TGCGCGACGA AGTCGGCTTG 
AGCGCGACCC TGGCCGGCAT CATCGGCAGC GGCGCCTATG TCGGCTACTG CCTCGCCATC 
GTGCTCAGCG CGCTGTTGGT GGAACGCTAC GGACCACGCC GGATCGCCGT CGCCGCCGCC 
CTGATCGCGG CGGTGGGCAT GGCGGGCGTC GCCGTCAGCA CGCAGGCGAT ATGGCTGGCC 
GGCGCCGTAC TGCTCGCCGG AACGAGCACC GGCCTGGCCT CGCCGCCCAT GGCGCAGGCG 
GTATCCCGCG CGATCACCGC GCCCCGGCAA GGGCGGGCCA ACACCGTCAT CAATGCCGGT 
ACCAGCCTGG GCGTCGCCGT CTCCGGGCCG GTCGCGTTCA TCGCCACCGG CCAGTGGCGG 
CTCGCCTACG CCGCCTTTGC CGTCACCGCG TTGCTCAACG CCCTGCTGCT GTTGATCAGC 
GTGCCACGCA CCAGCGCCAA CGATACCGCC AAGGCGGCCG ACGGCCAGGA CGACGACCTC 
CCCGGCGGGC TCTGGCGGCC TCGTGCAGTG ACGCTGATCG CCGCAGCCAC CGGCATGGGC 
GTGGCCAGCG CCGCCTTCTG GACCTTCTCG AGCGAAGTGG TCATCACGCT GGGGCACTTC 
GAGCAGGCCA CGGCCAACAT CGCCTGGATC CTGATCGGCG TCGCGGGGCT GGTAGGTGGC 
GCGGCAGGCG ACCTGATCGC ACGGCTCGGC CTCAACACCG TGCATCGTGG CAGTCTCGCG 
GCGATGGCCG GTGCACTCGG GCTGCTGGTC CTCAGCCCCT CGAACCTGGC GGCGGTGCTC 
GTCTCGGGCG CGCTGTTCGG CGCGGCCTAC ATCATGCTGA CCGGCGTCTA TCTCGTCTGG 
GGCATCCGGC TGTATGCGGA CCGCCCCGCC ATCGGCCTCG GGCTTCCCTT TCTGATGATC 
GCCGCGGGGC AGATCGTCGG CTCGCCCCTC GCGGGCTACC TGATCGGCAG CCGAGGGTAC 
CTCGTCTGCT TCATCGCCTT CGCGCTGATC GCAGTGGCCA CGGCTCTCAT CGGCGCCAGG 
ACCACCGAGC GCGCGGCGCT CCAACCGGCT TCCACTTCCC CCTGA

Protein sequence

MTRTEFRLIV AGTMLIGTTY GLARFAYGLF LPSMRDEVGL SATLAGIIGS GAYVGYCLAI 
VLSALLVERY GPRRIAVAAA LIAAVGMAGV AVSTQAIWLA GAVLLAGTST GLASPPMAQA 
VSRAITAPRQ GRANTVINAG TSLGVAVSGP VAFIATGQWR LAYAAFAVTA LLNALLLLIS 
VPRTSANDTA KAADGQDDDL PGGLWRPRAV TLIAAATGMG VASAAFWTFS SEVVITLGHF 
EQATANIAWI LIGVAGLVGG AAGDLIARLG LNTVHRGSLA AMAGALGLLV LSPSNLAAVL 
VSGALFGAAY IMLTGVYLVW GIRLYADRPA IGLGLPFLMI AAGQIVGSPL AGYLIGSRGY 
LVCFIAFALI AVATALIGAR TTERAALQPA STSP