Gene Csal_0093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0093
Symbol
ID	4026015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	116845
End bp	118059
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	67%
IMG OID	637965244
Product	hypothetical protein
Protein accession	YP_572156
Protein GI	92112228
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3616] Predicted amino acid aldolase or racemase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGCAC CCGGGAACTG GGAAATGGAG AAGGGCATGC CGCCGTCGCG TCCGGCGCAC 
CTGCTGCATG ATGTGCCGCT GCCGGCGGCG GCGGTCTTCG AGGCGCCGCT GACCCACAAC 
CTGGCGTGGA TGCAGCGCTT CGCCGAGGGG CATGGCGCCA AGCTGGCGCC GCACGGGAAG 
ACCACCATGG CCCCGGCATT GTTCAGGCGA CAGCTCGAGG CGGGCGCCTG GGGAATCACG 
CTGGCGACGG CGGTGCAGAC GGTGACGGCG CATGCCCATG GCGTCGACCG TGTGCTGATG 
GCCAACCAGC TGGTCGGCCG GCCGAACATG ACGCTGGTGG CGGATGCCAT CGAGGCGGGG 
CTGGAGTACT ACTGCGTGGT GGACGGCGTC GATAACGTGC GCGATCTAGG GGCGTTCTTC 
GCCGACAGGG AGCTCACGCT GAACGTGCTG ATCGAGCTGG GCGTCGATGG CGGACGCTGC 
GGCTGCCGCA ACGCCGCGCA GGTCGATGCG CTGGTGGCAG AGATCGCCAG GCAGCCCGCG 
CTGGCCCTCG TCGGCATCGA AGGTTACGAG GGGATGATCG CCGGCGGCGA TGAAGCCGCT 
GCCGTGCGTG CCTACGGCGA GCGGTTGGTC GAGACCGTCC GCACGTTGCA GGCCAGTGAT 
GTTCTGCAAC GCGAGGCGCC GATCGTCACC GCTTCCGGCT CCAAGTGGTT CGACCTGATC 
GCGGAGACGT TCGACAGGGC GGAGCTGCGC GAGCACTACA CGCCGGTGCT GAGGCCGGGC 
TGCTACGTGG TGCACGATCA CAAGCTCTAT GCCGGTGCGA TGGAGGCGAT CAAGGCGCGC 
GATCCCGGCC TGGAGGGCGA GCTGCGCCCG GCGCTGGAAG TCTTTGCTCA TGTGCAGTCG 
CTGCCCGAAC CGGGCCTGGC GATCATTGCG CTGGGCAAGC GCGATATCGG GCACGAGCCT 
GATCTGCCGT TGCCGCTACG CCGCTATCCA CGGGAGGCGG GAGGTACGGT GAGTGTGGAC 
GTCAGCGGCT GGCGAACGAC GCACATCATG GATCAGCATG CGTTTCTCGA GATTCCCGAG 
CACGCCGATA TCGCGGTAGG CGATGTGCTG GCCTTCGGCA CGTCCCATCC CTGCCTGACG 
TTCGACAAGT GGCGGCGCGT ACTATGCGTC GATGAAGCGC TGGCAGTGAA GGAAGTGATG 
ACGACGCATT TCTGA

Protein sequence

MVAPGNWEME KGMPPSRPAH LLHDVPLPAA AVFEAPLTHN LAWMQRFAEG HGAKLAPHGK 
TTMAPALFRR QLEAGAWGIT LATAVQTVTA HAHGVDRVLM ANQLVGRPNM TLVADAIEAG 
LEYYCVVDGV DNVRDLGAFF ADRELTLNVL IELGVDGGRC GCRNAAQVDA LVAEIARQPA 
LALVGIEGYE GMIAGGDEAA AVRAYGERLV ETVRTLQASD VLQREAPIVT ASGSKWFDLI 
AETFDRAELR EHYTPVLRPG CYVVHDHKLY AGAMEAIKAR DPGLEGELRP ALEVFAHVQS 
LPEPGLAIIA LGKRDIGHEP DLPLPLRRYP REAGGTVSVD VSGWRTTHIM DQHAFLEIPE 
HADIAVGDVL AFGTSHPCLT FDKWRRVLCV DEALAVKEVM TTHF