Gene Csal_1701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1701
Symbol
ID	4028539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	1933469
End bp	1934443
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	66%
IMG OID	637966889
Product	periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system-like protein
Protein accession	YP_573752
Protein GI	92113824
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1732] Periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system (osmoprotectant binding protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.656408
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGCAACC AGCTACCGAC CGGGCGCAGC GCCCTGATGT TCAGCACGGC CCTGGCCGCT 
TTGCTTCTGG CAGCGCCTTC CGTGTCGGCC AATGAGGCCG AGCAGGAAGC GTCGGCCAGC 
AAGCACGGAC CGGAAACCAT CGCCAACCAG TTCGTGTTCG GCTCCGGCAA GGAGTGCCCG 
CATGAGCCGT ACTGCCTGCC CGCGCTCGAG GAAGAGTATG GCTTGCACTT CGCCGATTTC 
GTGGTCACCG ACCCCGGGGG GCCGCGCACG CGCGAGGCGC TTCTGAACGG CGACATCCAG 
ATTGGCGTGC TCTTCACTAC CAACGGGTAT CTCGCCACTG ACCGCTTCGT CCTGCTGGAG 
GACGATCGTA ACGCCCAGCC GGCGGAAAAC GTCATTCCGG TGGCCCACCA GTCCATCGGC 
GACGCCTACC CCGAGCTCGG CGAGGTGCTC GATCCGCTCA GCGCCGTCCT GACGACCCCG 
GAGCTGGCCG AGATGAATCG ACGCTTCGCG CTCGACGGGG TGGACGCGGA GACCATCGCC 
CGAGAGTGGC TCAAGGAGCA CGGCGCGCCC GCGCCTGCGG AGAGTGCGCC GGAAAAAGAG 
GGCCCCACCA TCGTGGTCGG CTCCGGTAAC TTCGCCGAGA GCATCATCCT GGCGGAAATG 
TACCACCAGG CGCTCGACCA GGCGGGATAT CCCACCCGGC ATCGGCAGGA AATCGGCAAC 
CGCGCCACCT ATCTTCCCCT GCTCGAAAGT GGCGAGATCG ACCTGTTCCC GGAATACACC 
GGCAGTCTGG GTGGCTGGCT GAACACGCTC GCCGACACGA GCGGGCAACC CCTGTCGGCA 
TTGCTGCCCG AACATGACCT GGTGGGCTTC GAGCCAGCCC CTGCGCAAGA CAAGAACGGC 
TTCGTGGTCA CCGCCGAGAC CGCACAGCGC TATGATCTCG AAAAGATCAG CGATCTGGCG 
AAGCCCGCTC CCTGA

Protein sequence

MSNQLPTGRS ALMFSTALAA LLLAAPSVSA NEAEQEASAS KHGPETIANQ FVFGSGKECP 
HEPYCLPALE EEYGLHFADF VVTDPGGPRT REALLNGDIQ IGVLFTTNGY LATDRFVLLE 
DDRNAQPAEN VIPVAHQSIG DAYPELGEVL DPLSAVLTTP ELAEMNRRFA LDGVDAETIA 
REWLKEHGAP APAESAPEKE GPTIVVGSGN FAESIILAEM YHQALDQAGY PTRHRQEIGN 
RATYLPLLES GEIDLFPEYT GSLGGWLNTL ADTSGQPLSA LLPEHDLVGF EPAPAQDKNG 
FVVTAETAQR YDLEKISDLA KPAP