Gene Csal_2354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2354
Symbol
ID	4027463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2644930
End bp	2646111
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	65%
IMG OID	637967558
Product	glycine betaine/L-proline transport ATP binding subunit
Protein accession	YP_574402
Protein GI	92114474
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCGAC TCGACAACTT GACCAAGGTC TTCGACACGC CCAAGGGCGC GGTGACCGCC 
GCCGACCACA TCAGCATGGA GGTGCCGAGC GGCGAGATCT GCATCCTGCT CGGCCCCTCC 
GGCTGCGGCA AGACCACCAC CCTGAAGATG ATCAACCGCA TCATCCGCCC GACCTCGGGC 
AAGGTGTTCA TCAACGGCGA GGACACCACC AGCCTCGACA CCCAGGACCT GCGCCGCAAC 
ATCGGCTACG TGATCCAGCA GATCGGTCTG TTCCCCAACA TGACCATCGA GGAGAACATC 
ACCGTGGTGC CCAAGCTGCT GGGCTGGGAC AAGGCCAAGT ACCGGGAGCG CGCCCGCGAG 
ATGATGCACA TGATCGCGCT GGAGCCGGAC GCCTTCCTCA AGCGTTATCC CAGCGAGCTT 
TCCGGCGGGC AGCAGCAGCG CATCGGCGTG GCCCGGGCGC TGGCCGCCGA TCCCCCCGTG 
ATGCTGATGG ACGAACCGTT CGGCGCCATC GACCCGATCA ACCGGGCGGT GATCCAGGAC 
GAGTTCCTGA AGATGCAGCA GGAGCTCAAG AAGACGATCA TGTTCGTCAG CCACGATATC 
GACGAAGCGA TCAAGATGGG CGACCGCATC GCCATCTTCC GCGCCGGCAA GCTGGTCCAG 
TACTCGGAGC CGGACGAGCT GCTCGCTGCG CCCAAGAACG ACTTCGTCGA ATCCTTCCTG 
GGCGAAGACC GGGCGCTGAA GCGCCTCAAC CTGGTCAAGG TCCGCGATCT GGCCAGCGAG 
GAAATCGGCC TCGTCCGCCC GGACGACACC CTGGCCACCG CCCTTCAGCG CATCGAGTCC 
TACGGGTACC AGAACAGCAT CGTGATGGTG AACCACAAGC GTCAGCCGGT GGGCATCATC 
ACCGCCCCCG TCGCCCGCAC CACCCAAGGC CATTGTCGCG ATCACTACCA GAGCGTGCCG 
GTGGTGGTCA GCCTCGACGA CGACCTGCGC AAGGTCGCCT CGCTGATGTT CGCCCACGAC 
ATGACCTGGG TGCCTTGCGT CGACGACGAC GGCCGCATCG TCGGCCAGAT CACCCAGCGC 
GCGATCACCC ATCACCTGGG GTCGCGCTAC CGCGCCCATT CCAAGGGCGA TGACGGCGTC 
GCGCTCGACG AGGCCTCTCC GTCATCGGCC CCCAAGGAGT AA

Protein sequence

MIRLDNLTKV FDTPKGAVTA ADHISMEVPS GEICILLGPS GCGKTTTLKM INRIIRPTSG 
KVFINGEDTT SLDTQDLRRN IGYVIQQIGL FPNMTIEENI TVVPKLLGWD KAKYRERARE 
MMHMIALEPD AFLKRYPSEL SGGQQQRIGV ARALAADPPV MLMDEPFGAI DPINRAVIQD 
EFLKMQQELK KTIMFVSHDI DEAIKMGDRI AIFRAGKLVQ YSEPDELLAA PKNDFVESFL 
GEDRALKRLN LVKVRDLASE EIGLVRPDDT LATALQRIES YGYQNSIVMV NHKRQPVGII 
TAPVARTTQG HCRDHYQSVP VVVSLDDDLR KVASLMFAHD MTWVPCVDDD GRIVGQITQR 
AITHHLGSRY RAHSKGDDGV ALDEASPSSA PKE