Gene Csal_2107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2107
Symbol
ID	4029252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2376671
End bp	2377774
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	63%
IMG OID	637967308
Product	hypothetical protein
Protein accession	YP_574157
Protein GI	92114229
COG category	[S] Function unknown
COG ID	[COG3021] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATTA CAACGATCAT CGAGACGACG CTGGCACTGC TGGCACTACT GCTCTTCGCG 
GCGACGGCGA TTCCGTGGCT GAACCTGCGC TACTGGTGGG TACGCGGTTT CGACTTTCCC 
CGCATGCAAC TGGCGATTCT CGCCGCCGTG ACGCTCCTCG CCCTGCTGAC CACCCTGCCA 
TGGGGCGTCT GGGGATGGGT CGGTGCAGTC GCCGCGCTCA TCGTCATAGG AGTACAAGGC 
GGCAGCATTT ATCACTGGAC ACCGCTCGCC AGGTGTCATG TGGTCGATGC CGACGGCGAA 
GATGCCTCGC GGCAATTCTC GCTGCTGGTC GCCAATGTTC TCACCAGCAA CCGCCAGTCG 
GCATCCCTCA TGCGCCAGAT CCGCGAGACC GACCCGGATA TCGTGCTGAC CCTGGAATCG 
GATGCCTGGT GGCAGGAGCG CCTCGACGAG ACGCTCGACG AGAGTCATCC GTATGCCACC 
CGGATTCCGC TCGACAATCT TTACGGCATG CACCTGTATT CTCGCCTGCC GGTACACGCC 
CCTCAGATCG AGTGGCTGAT CCAGGATGAT ATTCCCTCGA TCCACGGCTG GTTCGAACTT 
CCCAGCGGCG ACCGTGTGCG GTTTCACGCC GTCCACCCAA GGCCGCCTGC GCCCGGCGAA 
AGCGATGAAT CCTTGTGGCG GGATGCCGAA CTCTTGCTGG TCGGTCAGAC GATTCGCGAC 
TCGGGGCTCC CCACTCTGGT GGCCGGCGAT CTCAACGATG TGGCATGGTC GAAGACCACC 
CGTCTGTTCT GCCGCATCAG CGGAATGCTC GATCCACGCC GGGGTCGCGG TCTCTACAGC 
ACCTTTCATG CCGAGTATCG ATGGCTGCGC TGGCCCTTGG ATCATGTCTT CGTCAGCGAA 
CATTTCACCC TGGTGGCCCT GCAGCGCCTC TCGGCCTTCG GCTCCGATCA TTTCCCGATC 
CTCGCCACCT TTCGCTACCA CCCGGCACGC GCCGACGAAA ACGACAGTCC CGAGGCCGAT 
CGCGAAGAAC GCCAGGATGC CGAGGAAACC ATCGAGGAAG CCCACGAACG ACGCGGCGAA 
GCGCCCGTCA AGCACGACGA CTGA

Protein sequence

MTITTIIETT LALLALLLFA ATAIPWLNLR YWWVRGFDFP RMQLAILAAV TLLALLTTLP 
WGVWGWVGAV AALIVIGVQG GSIYHWTPLA RCHVVDADGE DASRQFSLLV ANVLTSNRQS 
ASLMRQIRET DPDIVLTLES DAWWQERLDE TLDESHPYAT RIPLDNLYGM HLYSRLPVHA 
PQIEWLIQDD IPSIHGWFEL PSGDRVRFHA VHPRPPAPGE SDESLWRDAE LLLVGQTIRD 
SGLPTLVAGD LNDVAWSKTT RLFCRISGML DPRRGRGLYS TFHAEYRWLR WPLDHVFVSE 
HFTLVALQRL SAFGSDHFPI LATFRYHPAR ADENDSPEAD REERQDAEET IEEAHERRGE 
APVKHDD