Gene Csal_2457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2457
Symbol
ID	4026595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2763180
End bp	2764139
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	67%
IMG OID	637967664
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_574503
Protein GI	92114575
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0936294
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCTA CCCCCCGACA CCGCACCCCA CTGGGCCGCT TGACGTCCAC GTTGCTCGGC 
GGCGCCATGG GCGCGCTGCT GCTCGCGCCT TTCGGGCTCG CCCAGGCCGA GGACGACATG 
GTCCGCTTCG GCACGCCGCA ATGGCCCGGC GCCACCGTCA AGTCGGAAGT GGCGCGACAA 
CTGCTGGACA CGCTCGGCTA TCGCACCTCG CTGCGGGAAG CCAGCTCGTC GATCATCCTG 
GAAGGCATGG CGAGCGGCGA TCTCGACGTC AACATGGCGC TCTGGCGGCC GTCGCAAAGC 
GGCATGCTCG AGCCCCGCCT GGCGGCCGGC GAGCTGGTCG AAGTCGTCAA GAACATCGAC 
GGCGCGCGCT TTCAGCTCGC GGTGCCCGAA TACGTGTGGG ACGCCGGTGT GCACTCGATG 
GCCGATCTCG CCGAGCACGC GGAACGCTTC GGCCGCACCT TCTATGGCAT CGAGCCGGGC 
AATGTCGGCA ACGAATTGAT GCAGAACGCC ATCGACGACG GCACCTACGG CCTGGATGAC 
TGGCGAGTCG CCGCGTCCAG CGAGACCGGC ATGATGTCGC AGGTCGAAAG CGACATCCGC 
AACGAGCAAT GGGTCGCGTT CCTGGGCTGG GAACCGCACT GGATGAACGT CGACTTCGAC 
ATTCGCTACC TGGAGGACCC CGAGAACCTC TGGGGCGACG CCAGCTCGGT ATCCACGGTG 
GTCGCCAGCG ACTTCGCCGA GCGTCATCCC AACGTCATCG CCTTTCTCGA CAACATGGTC 
GTGCCCATCG CCGTCCAGGA CCAGTGGGTC TACGCCTACA GCCGCGAGGA CCAGCCGCTG 
GAAGCGGTCG CCGCGACCTG GATCCAGTCG CACCCCGAAC GGGTCAACGC CTGGCTCGAG 
GGCGTGACCA CCGCGGATGG CGAGACCCGC GCGCAAGACG CCTATCAGGC CTCGCGTTGA

Protein sequence

MTATPRHRTP LGRLTSTLLG GAMGALLLAP FGLAQAEDDM VRFGTPQWPG ATVKSEVARQ 
LLDTLGYRTS LREASSSIIL EGMASGDLDV NMALWRPSQS GMLEPRLAAG ELVEVVKNID 
GARFQLAVPE YVWDAGVHSM ADLAEHAERF GRTFYGIEPG NVGNELMQNA IDDGTYGLDD 
WRVAASSETG MMSQVESDIR NEQWVAFLGW EPHWMNVDFD IRYLEDPENL WGDASSVSTV 
VASDFAERHP NVIAFLDNMV VPIAVQDQWV YAYSREDQPL EAVAATWIQS HPERVNAWLE 
GVTTADGETR AQDAYQASR