Gene Csal_3089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_3089
Symbol
ID	4028895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	3441953
End bp	3443080
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	67%
IMG OID	637968303
Product	periplasmic binding protein
Protein accession	YP_575132
Protein GI	92115204
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCACCT CACTATTCAA AGCCGCCGCC GGCGCAGTCC TCACCCTCGC TGCCACGACC 
GCGCTGGCCG AAGAGATCAC CGTCACTGAC GTCGCCGGCC GCCAGGTCAC CGTCGACGCT 
CCCGTGAATC GCCTGATTCT CGGTGAGGGG CGCCAGATCT ATCTGCTCGG CGCGCTGCAG 
CCGGAGACCC CCTTCGAGCA CGTGGTGGGC TGGCGCGAGG ACTTCTCGCA GGCCGATCCG 
GACAACTACG CCGCCTATGC CGCCAAGTTT CCCGAGATGA AGCAGATCCC CACCTTCGGT 
GGCTTCAAGG ACGGCACCTT CGATGTGGAG CAGGCTGCTG CGCTACAGCC CGACGTCGTG 
CTGATGAACC TGGAGGCCAA GGCCGCCACC GAGGACGCCG CCTACGACGA CAAGCTGGCC 
GAACTGGGCA TCCCGATCGT CTACGTGGAC TTCCGCGAGG CGCCGCTCGA ACACACGACG 
CCTTCCATGC GACTGATCGG CCGGCTACTC GGCGAGGAAG AAAGGGCCGA GGCCTTCATC 
GACTATTCAC AGGCCCAGAT GGCGCGCGTC GCCGAGACCA TCGAAACTGC CGACCCCCAG 
CGTCCCCGGG TCTTCATCGA TCGTGCCGGC GGCTATTCCG ACGACTGCTG CATGAGCTTC 
GGCCCGGGCA ACTTCGGTAA ATACGTCGAG CTCGCCGGGG GGAGCAACAT CGCCGACGGC 
ATCATTCCCA ACACCTTCGG CCGGCTGAAC CCGGAGCAGA TCATCGCCGC CGACCCGCAA 
CAGGTGGTCG TGACCGGCGG CCACTGGGAC GCCTACGTGC CCGGCGGCGA CTGGGTGGGC 
GTGGGCCCCG GCGCCGACCT GGCGGCCGCG CGGACCAAGC TCGAAGGGCT CACCGAGCGC 
ACCGCCATGG CCGGCATCGA CGCCGTGCAG ACCGACAATT TTCACGCCAT CTGGCACCAG 
TTCTACAACA GCCCCTACTA CTTCGTCGCC GTGCAGCGGC TGGCCAAGTG GTTCCACCCC 
GAGCTGTTCG CCGACCTCGA CCCCGAGGCG ACGCTGCGGG AGTTGCACGA ACGCTTCCTG 
CCGGTGGACT ACGTGCCGGG CTACTGGGTC TCGCTGAAGG GTGACTGA

Protein sequence

MLTSLFKAAA GAVLTLAATT ALAEEITVTD VAGRQVTVDA PVNRLILGEG RQIYLLGALQ 
PETPFEHVVG WREDFSQADP DNYAAYAAKF PEMKQIPTFG GFKDGTFDVE QAAALQPDVV 
LMNLEAKAAT EDAAYDDKLA ELGIPIVYVD FREAPLEHTT PSMRLIGRLL GEEERAEAFI 
DYSQAQMARV AETIETADPQ RPRVFIDRAG GYSDDCCMSF GPGNFGKYVE LAGGSNIADG 
IIPNTFGRLN PEQIIAADPQ QVVVTGGHWD AYVPGGDWVG VGPGADLAAA RTKLEGLTER 
TAMAGIDAVQ TDNFHAIWHQ FYNSPYYFVA VQRLAKWFHP ELFADLDPEA TLRELHERFL 
PVDYVPGYWV SLKGD