Gene Csal_1675 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1675
Symbol
ID	4028687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	1904107
End bp	1905324
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	64%
IMG OID	637966864
Product	major facilitator transporter
Protein accession	YP_573727
Protein GI	92113799
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.816846
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAACCTG CCCGCCTGGA AAAGCGTAAC GTGGCCATTC TGGTCAGCAG TCAGATTCTG 
TTCATGGTGG CCTCGATCAC GGTCATGACG CTGAGCGGGA TGGTCGGCCT GCAGTTGAGC 
CCGACCTCTG GGCTCGCCAC GCTGCCCATT GCCATCTCGA TGCTGGGTAC GGTGGCCTCG 
ACCCTGCCGG CTTCGCTCTA CATGAAGCGC GTGGGCAGGC GCCGCGGGTT CATCACCGGC 
ACGATCCTGG GCGGCATCGC GGGTGGCTTG CTGAGTTTCG TGGCCATTGC CCAGCAGTCG 
TTCTGGCTGT TCTGCGTCGG CAACCTGCTG CTGGGGCTCT ACCAAGGATT CGCCATGTAC 
TATCGCTTTG CCGCTCTGGA CGTGGCGAGC CCTGCCTTTC GCAGCCGGGC GATTTCTTTC 
GTCATGGCGG GGGGCGTGGT GGCTGCGTTC CTCGGCCCCT GGAACGTCAG TGCCACGGCC 
GACTGGATCG CCGGCGTGCC GTCCGGTGGG CCTTACCTGG TGATCGCCAT TCTCGCCCTG 
TTGGCCACCG GCCTGCTGAC CCAGCTCAAG ATGCCCGCCA GTGAGGAACC GCAACCCGGC 
GAGACGTCTC GACCCATGCC GGTCATTGCC ACTCAGGCGG GTTTCATGGT CGCCTTGCTG 
GCCGGCGCGG TGGGCTACGC CATCATGACA CTGGTCATGA CGGCCACGCC GCTGGCCATG 
CGCGCGCATG GCTTCGGGAT GGAGCAGATT GCCTTCATCA TGCAGTGGCA TGTGCTAGGC 
ATGTTCGCCC CCTCCTTCGT GACCGGCAGC CTCATCGCCC GCTTCGGGAT ACCGCGCATG 
CTGCTGACCG GCACGCTCTT GATGGCCGGC ACGGCCCTGA TCAGCAATCT TGGCGTTAGC 
CTGGCCCATT TCTGGGTGGC CCTGGTACTG CTGGGTATCG GCTGGAACTT CCTGTTCGTG 
GGCGGCAGCA CCCTGCTCTC GGCCGCCCAT ACGGATGCCG AACGCGGCAA GGTACAGGGC 
ATCAATGATC TGGTCATCTT CTCCCTGGTC GCCCTCGGCT CTCTGATGTC GGGCGCATTG 
TCGTACCACC TTGGCTGGAA GGCGCTCAAT CTGGCGATGC TGCCCCCCAT TGTGCTGGTG 
GCCCTGGCCA CGCTCTGGTA TCGCTGGCAC GCCGCCGCGA AGCCTTCCAT CAGCCTGGCG 
CCTCAATCCA AGAAGTGA

Protein sequence

MEPARLEKRN VAILVSSQIL FMVASITVMT LSGMVGLQLS PTSGLATLPI AISMLGTVAS 
TLPASLYMKR VGRRRGFITG TILGGIAGGL LSFVAIAQQS FWLFCVGNLL LGLYQGFAMY 
YRFAALDVAS PAFRSRAISF VMAGGVVAAF LGPWNVSATA DWIAGVPSGG PYLVIAILAL 
LATGLLTQLK MPASEEPQPG ETSRPMPVIA TQAGFMVALL AGAVGYAIMT LVMTATPLAM 
RAHGFGMEQI AFIMQWHVLG MFAPSFVTGS LIARFGIPRM LLTGTLLMAG TALISNLGVS 
LAHFWVALVL LGIGWNFLFV GGSTLLSAAH TDAERGKVQG INDLVIFSLV ALGSLMSGAL 
SYHLGWKALN LAMLPPIVLV ALATLWYRWH AAAKPSISLA PQSKK