Gene Csal_2357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2357
Symbol
ID	4027466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2647936
End bp	2648838
Gene Length	903 bp
Protein Length	300 aa
Translation table	11
GC content	65%
IMG OID	637967561
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_574405
Protein GI	92114477
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1732] Periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system (osmoprotectant binding protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0367531
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACAAT CCCTGCTCCC GCTGATCGGC GGCCTGGCTC TCGCCAGCAC CCTCGTCAGC 
CCCCTCACCA GTACCGCCGC CCACGCCGAG GACATCACCG TCGGCGGCAA GAACTTCACC 
GAACAGCTCA TCCTGTCAAG CATGACCACG CAATACCTCC AGGCCCATGG CTACGAGGTG 
GACCAGCGCG CCGGCATGGG CACCACGGTG CTGCGCCGCG CCCAGGAGAG CGGCCAGGTG 
GATCTCTACT GGGAATACAC CGGCACCTCG CTGATCAGCT ACAACAAGGT GACCGAGGAC 
CTCTCGCCGG AGGCCACCTA CGAGCGCGTC AAGGAACTCG ACGCCGAGAA GGGGCTGATC 
TGGCTCGAGC CCTCCGAGGC CAACAACACC TACGCCCTGG CCATGCGCAA AGACGACGCC 
GAAGCACGCG GCATCGCCAC CATTTCCGAT CTCGCCGACG TCATCAATGG CGGCCAGGAA 
CTTGTGCTCG CCTCCAACGC GACCTTCTAC TCGCGCGATG ACGGCCTGCG CCCGATGCAG 
GAGACCTATG GCTTCGAGTT CGGCCGGCGC AACGTGAAGC GGATGGACCA GGGCCTGACC 
CTGACCTCGC TGGATCAGGA AGAAGTCGAC GTGGCGATGA CCACGGCGAC CAACGGGCGC 
ATCCCGGCCC TGGACCTGAC CGTCCTCGAG GACGACAAGA ACTTCTTCCC CGACTATGCG 
CTGACCCCGG TGGTCCGCGA GGAAACGCTC GAGGCGAACC CCGATCTCGA CGAACGCATG 
AACGCGCTCT CCGCCCTGCT CGATGACAGC ACCATGGCGC GCCTCAACGC CAAGGTCGAC 
GTCGACAAGC AGCCCGTCGA GAAGGTCGCC GAGCGCTTCC TCGAGGAGCA CGACCTGCTG 
TAA

Protein sequence

MRQSLLPLIG GLALASTLVS PLTSTAAHAE DITVGGKNFT EQLILSSMTT QYLQAHGYEV 
DQRAGMGTTV LRRAQESGQV DLYWEYTGTS LISYNKVTED LSPEATYERV KELDAEKGLI 
WLEPSEANNT YALAMRKDDA EARGIATISD LADVINGGQE LVLASNATFY SRDDGLRPMQ 
ETYGFEFGRR NVKRMDQGLT LTSLDQEEVD VAMTTATNGR IPALDLTVLE DDKNFFPDYA 
LTPVVREETL EANPDLDERM NALSALLDDS TMARLNAKVD VDKQPVEKVA ERFLEEHDLL