Gene Csal_0201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0201
Symbol
ID	4027166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	220634
End bp	221989
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	65%
IMG OID	637965352
Product	peptidase
Protein accession	YP_572264
Protein GI	92112336
COG category	[S] Function unknown
COG ID	[COG3182] Uncharacterized iron-regulated membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCGTA CTTCTGCGCG TTCTTCACGT GACGCCAGCG ACCTCTATCG GGCGGTCTGG 
CGCTGGCATT TCTACGCGGG TCTCATCGCG ATTCCCTTTC TGATCTCGTT GGCGGTGACC 
GGCGGGCTCT ACCTCTTCAA GGATGAGATC GACCAGTGGC TCAACGCGGA CATCGTGCGC 
GTCGAGGCGC AATCGTCAGC GGCGGTGTCG CCGCAGCAAC AGCTGGATGC GGCCATGGCG 
GCGCATCCCG GCGAGGCGTT TCGTTACGTG CCGCCGGCCG CCTCCAATCT TGCCGCGGAG 
GTCGACATCA CCACCGCCGA CGGCAAGCAA GCCGTCTACG TCGACCCTTA CACCGGCGAG 
GTCACTGGCA CGATTCCCTA TCGCGGCAGC GTGATGTGGA TCGTGCGCAC CATCCACAGC 
CTCAGCTACT TCGGCGAGAC GGCGAGTCTG ATCATCGAGA TCGTCGGCGG CTGGTCGATC 
CTGCTCGTGC TGACCGGAAT CTATCTGTGG TGGCCGCGCG GTCGACGCGG CGGTGTGATG 
ACGGTACGTG CGACCCCGGC GAAGCGATTG TTCTGGCGTG ACCTTCACGC CGTCACCGGC 
ATCTTCGTCG GGGGCTTCAT TCTTTTTCTG GCGATGACCG GCATGCCGTG GTCCACGCTG 
TGGGGCAGCA AGGTCAACGA ACTCGCCAAC GGTCACAACT TCGGCTATCC GGATGGCGTG 
CGCGTCAACG TCCCGGTCTC CGACGAACGC CTGGCGGAGC GGGAGATGAC TACCTGGTCG 
CTGGAGCAGG CGCGGCTGCC GGAATCGACG CCTGGGCGTG AGGGCGCGCC GGGCATCGGC 
CTCAACGGCG CGGTGAAGGC GTTCGACGCG CTGGGGCTGG CCCCAGGATA TGCCGTCAGC 
CTGCCGAGCA GTCCTACCGG CGTCTATACC GGCTCGATCT ACCCCGACGA TCTTTCACGA 
CAGCGGGTCG TGCATCTGGA CCGATATAGC GGCGAGCCAC TGCTGGACAT GAGCTACGCC 
GACTATGGCC CGTTGGGCAA GTCGCTGGAG TGGGGCATCA ACGTGCACAT GGGCCAGCAA 
TATGGGCTCG CCAATCAGTT GATTCTGGCG CTGGCCTGCG CGGGGATCGT GCTGCTGTGC 
GTCTCGTCGG GCGTGATGTG GTGGAAGCGT CGACCGAGCG GCAAGCTGGG GATTCCCCCC 
GAACCCAAGG ATCCCCGTCG CTTGCGCGGT GTGCTGGCGT TGCTCGCCAT CGGCGGCGTG 
ATCTTCCCGC TGGTGGGGGC CTCGATGATC GTCATGGCGG TGGTGGATGC GCTGGTACGC 
CGTCGCGGCG CCAGGCGCGC CGCGACGACC GCCTAG

Protein sequence

MSRTSARSSR DASDLYRAVW RWHFYAGLIA IPFLISLAVT GGLYLFKDEI DQWLNADIVR 
VEAQSSAAVS PQQQLDAAMA AHPGEAFRYV PPAASNLAAE VDITTADGKQ AVYVDPYTGE 
VTGTIPYRGS VMWIVRTIHS LSYFGETASL IIEIVGGWSI LLVLTGIYLW WPRGRRGGVM 
TVRATPAKRL FWRDLHAVTG IFVGGFILFL AMTGMPWSTL WGSKVNELAN GHNFGYPDGV 
RVNVPVSDER LAEREMTTWS LEQARLPEST PGREGAPGIG LNGAVKAFDA LGLAPGYAVS 
LPSSPTGVYT GSIYPDDLSR QRVVHLDRYS GEPLLDMSYA DYGPLGKSLE WGINVHMGQQ 
YGLANQLILA LACAGIVLLC VSSGVMWWKR RPSGKLGIPP EPKDPRRLRG VLALLAIGGV 
IFPLVGASMI VMAVVDALVR RRGARRAATT A