Gene Csal_2943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2943
Symbol
ID	4028338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	3280833
End bp	3281765
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	65%
IMG OID	637968150
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_574987
Protein GI	92115059
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1732] Periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system (osmoprotectant binding protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGGAA CGTTTCAACA CCTCGCCACC CGCGTGCTTG GCCTGGCGGC CGTCACCGCG 
CTGTCGATAT CGCCGGTCTT CGCCGCCGAC CCGGTACGGG TATCCTCGAA GATCGACACC 
GAGGGGGCCT TGCTGGGCAA CATGATGGTC CAGCTCCTGG AGCATGCCGA CGTTCCCGTG 
GAGGAAAACC TCCAGCTCGG ACCCACCAAC ATCGTGCGCA GCGCCCTGCT GGAAGACGAG 
ATCGACCTGT ATCCCGAGTA CACCGGCAAC GGCGCCTTCT TCACCCAGAC TACCGACGAT 
CCGGCCTGGA AACAGGCCGA GGCGGGCTAC GAGAAGATCC GTGCCTACGA CAAGCAGCAC 
AACGATCTCG TCTGGCTGAC ACCCGCACCG GCCAACAACA CCTGGGCGAT CGCCCTGCGT 
CGGGATATCG CCGACGAGCA CGATCTCTCC ACCATGCAGG ACTTCGCGGC CTGGGTACGC 
GACGGAGGCG AGGTGAAACT CGCCGGCTCG GCGGAGTTCG TGGAGAGCGA TGCCGCCCTG 
CCCAGCTTCC AGCGTGCGTA CGACTTCACG CTCGACCAGG AGCAACTGCT GGTGCTTTCC 
GGCGGCAACA CGGCCGCCAC CATCCGCGCG GCGGCCAATA ATACCAGCGG TACCAACGCG 
GCGATGGTCT ACGGCACCGA TGGCGCGATC GCCGCGGCCG ACCTCAGGGT CATGGACGAT 
ACCCAGGGCG TACAGATGGT CTATGCGCCG GCGCCGGTGA TCCGCCAGGC GACGCTCGAC 
GCCTACCCCG AGATTCCGGA GCTGCTCGGC CCCTTGTTCG AGGGACTCGA CCGCGAGACG 
CTGCAGACCC TCAACAGCCG CATTCAGGTA GATGGCATGC CGGCGAGTGA CGTCGCACGC 
GATTACCTCG AATCGCAAGA CCTGCTCGAC TAA

Protein sequence

MPGTFQHLAT RVLGLAAVTA LSISPVFAAD PVRVSSKIDT EGALLGNMMV QLLEHADVPV 
EENLQLGPTN IVRSALLEDE IDLYPEYTGN GAFFTQTTDD PAWKQAEAGY EKIRAYDKQH 
NDLVWLTPAP ANNTWAIALR RDIADEHDLS TMQDFAAWVR DGGEVKLAGS AEFVESDAAL 
PSFQRAYDFT LDQEQLLVLS GGNTAATIRA AANNTSGTNA AMVYGTDGAI AAADLRVMDD 
TQGVQMVYAP APVIRQATLD AYPEIPELLG PLFEGLDRET LQTLNSRIQV DGMPASDVAR 
DYLESQDLLD