Gene Csal_0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0120
Symbol
ID	4026572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	142200
End bp	143228
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	61%
IMG OID	637965271
Product	extracellular solute-binding protein
Protein accession	YP_572183
Protein GI	92112255
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID	[TIGR01096] lysine-arginine-ornithine-binding periplasmic protein

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTATA AGAACAAGTT CATTGTTGCC GTTCCGGCTG CCCTGCTACT CAGTGGTTTC 
GCGACTGCCT CCCAGGCGGC GACCCTCGAC GACGTCAAGG AGCGTGGCAA CCTCAATTGC 
GGGGTCAACG TCGGTCTGGC CGGGTTCTCG GCACCGGATG CCGACGGCAA CTGGCAAGGG 
CTCGATGTGG AAACCTGCCG GGGCATCGCC TCCGCGATCT TCGGCGATCC CGATAACGTC 
GTCTTTACCC CGTTGACCGC GAAGGAGCGC TTCACCGCGC TGCAGTCCGG CGAAATCGAC 
GTGCTGTCAC GCAACACGAC CTGGACGGCG ACGCGTGACA ACTCTCTCGG TCTGAACTTC 
ACCGCGACCA CCTTCTACGA CGGTCAAGGT TTCATGGTGA GCAAGGATCT GAATATCGAG 
AGCCTGGAAG GCCTCAACGG CGCTTCCATC TGCATTCAGT CCGGCACCAC GCACGAGCTG 
AACCTGGCCG ATTACTTTCC CTCCCGCGAT ATCGAGATCA AGACCGTCAC GTTCGACACG 
CCCGACCAGA CCGCTCAGGG GTTCGCTCAC GGGCGCTGTG ACGTGCTGAC CTCCGATACT 
TCTCAGCTGA GCGCGTTGCG CCTGCAATTG CCCGAACCGG ATAGCGTCGA GATCCTCGAG 
ACGCTGATTT CCAAGGAACC GCTGGGGCCG GTGGTGCGCC AGGGGGACGA CCAATGGCTG 
GATATCGTGC AGTGGACCAT CTTCGCCATG GTCAACGCCG AGGAAATGGG CGTTAACAGC 
GACAACGTCG ACGAAATGCG CGATAACCCG CCCAACCCCG GGGTAGCACG CCTGCTGGGC 
AAGGATGGCA ACTATGGCGA GCAACTCGGT CTGCCCAACG ACTGGGCGTA CAACATCATC 
AAGAACGTCG GCAACTACGG CGAAGTGTTC GCGACCACCG TGGGCGAAGA CTCGCCGCTG 
AAGATTCAGC GTGGCATGAA CGCCCTCTGG AACGAAGGCG GGATTCTCTA TGCACCGCCG 
ATTCGCTGA

Protein sequence

MLYKNKFIVA VPAALLLSGF ATASQAATLD DVKERGNLNC GVNVGLAGFS APDADGNWQG 
LDVETCRGIA SAIFGDPDNV VFTPLTAKER FTALQSGEID VLSRNTTWTA TRDNSLGLNF 
TATTFYDGQG FMVSKDLNIE SLEGLNGASI CIQSGTTHEL NLADYFPSRD IEIKTVTFDT 
PDQTAQGFAH GRCDVLTSDT SQLSALRLQL PEPDSVEILE TLISKEPLGP VVRQGDDQWL 
DIVQWTIFAM VNAEEMGVNS DNVDEMRDNP PNPGVARLLG KDGNYGEQLG LPNDWAYNII 
KNVGNYGEVF ATTVGEDSPL KIQRGMNALW NEGGILYAPP IR