Gene Csal_3003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_3003
Symbol
ID	4028969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	3342319
End bp	3343317
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	60%
IMG OID	637968209
Product	ectoine hydroxylase
Protein accession	YP_575046
Protein GI	92115118
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG5285] Protein involved in biosynthesis of mitomycin antibiotics/polyketide fumonisin
TIGRFAM ID	[TIGR02408] ectoine hydroxylase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGTGT TTGTCGGCGC CGACCTCTCC GACTACGTTT TCTCGGGGAT CGGCGGCAAT 
ACCGTTCCCA GCAGACTAAT GGAGGAGTTT GCAATGAAAG AGACACAAGA CCTGTTTCCG 
ACGCGCCTGG AACGCAAACT GGGAATGTTC GAGCGCATCG ATCCGGTCGT ACACAGTGAA 
GGCGATCAGC GCAAGGGGCC GCTCAGCGAA GCCGAGCTCG ACGAGTTCGA CCGCAAGGGG 
TTCCTGTCTT TCGAGGGGTT CTTCGACGAG GACGAAATGG AAGCGTTCCT CCAGGAGCTC 
CGCGACTACG AGAGCGATGA AGACCTCAAG CTCTCGGAAG GCACCATTCT CGAGCCCGGC 
AAGCAGGAAA TCCGTTCGAT CTTCGGCATC CACGAGGTGT CAGAACGTTT CAGTCGTCTG 
ACGCGCGATC CACGCCTATT GGCCATGGTG CAACAGATCC TCGGTGGCGA TGCCTACATT 
CACCAATCGC GGATCAACTA CAAGCCGGGC TTCAAGGGCA AGGGCTTCGA CTGGCATTCG 
GATTTCGAGA CCTGGCACAG CGAGGACGGC ATGCCGCGCA TGCGCTCGGT GAGCTGCTCG 
ATCATTCTCA CCGAAAACGG CGAGTTCAAC GGTCCGCTGA TGCTGGTGCC CGGTTCGCAC 
CATTATTTCG TGCCCTGCGT GGGGCGTACG CCGGAGGACA ACTACAAGGA GTCGCTGAAG 
AGTCAAGACA TCGGCGTGCC GGACGATGCC AGCCTGCGCG ACCTGATGCT CAAGGGCGAT 
ATCGAAGCCC CCAAGGGTCC CGTCGGGTCG CTGGTGATGT TCGAGTGCAA CACCCTGCAC 
GGCTCCAACA TCAACATGTC GTGCTGGCCG CGCAGCAACC TGTTCTTCGT CTACAACAGT 
GTCGAGAACA CGCTGCACGA CCCGTATTGC GGCAACCGTC CGCGGCCCGA GTTCCTCGCC 
AACCGCAAGG ACTGGCGGCC GCTGACACCG GCCGAGTAA

Protein sequence

MAVFVGADLS DYVFSGIGGN TVPSRLMEEF AMKETQDLFP TRLERKLGMF ERIDPVVHSE 
GDQRKGPLSE AELDEFDRKG FLSFEGFFDE DEMEAFLQEL RDYESDEDLK LSEGTILEPG 
KQEIRSIFGI HEVSERFSRL TRDPRLLAMV QQILGGDAYI HQSRINYKPG FKGKGFDWHS 
DFETWHSEDG MPRMRSVSCS IILTENGEFN GPLMLVPGSH HYFVPCVGRT PEDNYKESLK 
SQDIGVPDDA SLRDLMLKGD IEAPKGPVGS LVMFECNTLH GSNINMSCWP RSNLFFVYNS 
VENTLHDPYC GNRPRPEFLA NRKDWRPLTP AE