Gene Csal_2466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2466
Symbol
ID	4026604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2773186
End bp	2774271
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	65%
IMG OID	637967673
Product	chorismate synthase
Protein accession	YP_574512
Protein GI	92114584
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.358807
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGGTA ATACATTTGG TAAGTTGTTC ACCGTCACCA CCTTCGGCGA GAGCCACGGC 
GAGGCGCTGG GGGCCATCGT CGATGGCTGC CCGCCGGGCG TGGCGCTCGA GGCCTCGGAC 
TTGCAGCATG ATCTTGATCG GCGCCGCCCG GGAACGTCGC GGCATACCAC CCAGCGCCGT 
GAGCCCGATC AGGTGCGCAT TCTTTCCGGG GTGTTCGAGG GCGTCACCAC CGGGACGCCC 
ATCGGCCTTC TGATCGAGAA TACCGATCAG CGCTCCAAGG ACTACTCGAA GATCAAGGAC 
CAGTTCCGGC CCGCCCACGC CGATTACACC TACCATCACA AGTATGGCAT TCGCGATTAC 
CGCGGAGGCG GGCGCTCGAG CGCGCGGGAG ACCGCGATGC GCGTCGCCGC CGGCGCCATT 
GCACGCAAGT TTCTGGCCTC GCAGGGCATT CGCGTGCGCG GTTACATGAG TCAGTTGGGC 
CCCATCGACA TCGCCTTCAA GCAATGGGAG GCCGTCGACA CCAATCCCTT CTTCTGCCCC 
GATCCGGACA AGCTTCCCGA GCTCGAAGCC TTCATGGATC AGTTGCGGCG CGACCAGGAC 
AGCGTCGGCG CGCGCATCAC GGTGGTCGCC GACGGCGTGC CGGTAGGGCT CGGTGAACCG 
GTCTTCGACC GCCTGGATGC CGACCTGGCG CATGCCTTGA TGAGCATCAA CGCGGTCAAG 
GGCGTGGAAA TCGGGGACGG TTTCGCATCG GTTGCCCAGC GGGGCAGCGA GCATCGCGAC 
GAAATGACGC CGCAAGGCTT TCTCTCCAAC CACGCCGGGG GAGTGCTGGG CGGCATTTCC 
TCGGGGCAGC CCCTGATTGC GCATCTGGCA CTCAAGCCGA CCTCGAGCAT CACCCAGCCC 
GGGCGCTCGA TCGATGTGCA CGGGGAGGCA GTCGAGGTCG TCACCAAGGG ACGCCACGAC 
CCTTGTGTCG GCATCCGGGC CACGCCGATC GCCGAGGCGA TGATGGCGCT GACGCTCATG 
GATCATTACC TGCGTCACCG GGCGCAGAAC GCCGATGTCG AGGTGAGCAC GCCGCGTCTT 
GGCTGA

Protein sequence

MSGNTFGKLF TVTTFGESHG EALGAIVDGC PPGVALEASD LQHDLDRRRP GTSRHTTQRR 
EPDQVRILSG VFEGVTTGTP IGLLIENTDQ RSKDYSKIKD QFRPAHADYT YHHKYGIRDY 
RGGGRSSARE TAMRVAAGAI ARKFLASQGI RVRGYMSQLG PIDIAFKQWE AVDTNPFFCP 
DPDKLPELEA FMDQLRRDQD SVGARITVVA DGVPVGLGEP VFDRLDADLA HALMSINAVK 
GVEIGDGFAS VAQRGSEHRD EMTPQGFLSN HAGGVLGGIS SGQPLIAHLA LKPTSSITQP 
GRSIDVHGEA VEVVTKGRHD PCVGIRATPI AEAMMALTLM DHYLRHRAQN ADVEVSTPRL 
G