Gene Csal_1019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1019
Symbol
ID	4027865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	1149731
End bp	1150738
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	64%
IMG OID	637966196
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_573075
Protein GI	92113147
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.642553
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATTCA CGCTATCCAC CCCGCGCAAG CTACTCGGAC TGGCCGTCGG CATGGCGCTC 
AGCGCCAGCC CGCTATTGGT CCAGGCGCAG AGCGACGACG AGGTCAAGAT CGGCTTCATC 
GTCAAGAAAC CCGAGCAGGC ATGGTTCATC AACGAACAAG ACGCCGCGAC CCAACTCGGC 
GAAGAGAAAG GCTTCGAGGT GGTGCGTCTG TCCGGCGAGG ATGGCCAGGA AGTGCTCAGT 
GCCATCGATA ACCTCCATTC CCAGGGAGCC GAGGGCTTCG TGATCTGTCC CCCGGATGTG 
CGTCTGGGGC CGGCGATCAT GAACCGTGCC GAGCAATACG GCATGAAGGT GGTGACCGTC 
GACGACCGTT TTGTCGGCGG TGATGGTGAG CCCATGGAGG AGGTGCCGCA CCTGGGGATG 
TCCGGCTACA AGATCGGCGA GCAGGTCGGC AATGCCATCG CCGAGGAGAT GGAACGTCGC 
GGCTGGGACC CGGAGGAGGT CGCGGCGCTG CGCATCACCA ACTACGAGCT GCCCACCGCC 
AAGGAGCGTA CCGACGGGGC GACTGCCGCG CTGCTCGACT CGGGCTTCAA GGAAGCCAAC 
ATCTTCGATG CGCCGCAGCA GAACACCGAT ACCAGCAGTG CCTTTGCTGC GGCCTCGCCG 
GTCTTCTCCA AGCGCAGCGA CTTCGAGCAT TGGGTGATCT ACGCGCTCAA TGAGGAAAGT 
GTGCTGGGCG GCGTGCGGGC CAGCGAGCAG TACGGGCTCG ATCCCGACCA GGTCATCGGC 
GTGGGGATCA ACGGCTCCGG TGCGGCCTTT GCCGAGTTCT CGCGCGAGAC GCCCACCGGC 
TTCTACGGCA CCGTGGCGGT CAGCTCGACC ATGCATGGAC GCCAGACGGC CGACAATCTC 
TACCAGTGGA TCACCGAGGG CGAGAAGCCG CCGGCCAACA CGGAAACCAC GGGCAAGCTG 
ATGACCCGCG ACAACTGGGA AGACGTTCGG GAAGAGCTGG GCTTGTGA

Protein sequence

MSFTLSTPRK LLGLAVGMAL SASPLLVQAQ SDDEVKIGFI VKKPEQAWFI NEQDAATQLG 
EEKGFEVVRL SGEDGQEVLS AIDNLHSQGA EGFVICPPDV RLGPAIMNRA EQYGMKVVTV 
DDRFVGGDGE PMEEVPHLGM SGYKIGEQVG NAIAEEMERR GWDPEEVAAL RITNYELPTA 
KERTDGATAA LLDSGFKEAN IFDAPQQNTD TSSAFAAASP VFSKRSDFEH WVIYALNEES 
VLGGVRASEQ YGLDPDQVIG VGINGSGAAF AEFSRETPTG FYGTVAVSST MHGRQTADNL 
YQWITEGEKP PANTETTGKL MTRDNWEDVR EELGL