Gene Cmaq_0808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0808
Symbol
ID	5708772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	843446
End bp	844447
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	43%
IMG OID	641275311
Product	chorismate mutase
Protein accession	YP_001540633
Protein GI	159041381
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0287] Prephenate dehydrogenase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01808] monofunctional chorismate mutase, high GC gram positive type

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0594729
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.450237
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTGGC AGTTGAGGAA GAGTATTGAT GAGGTTGATG ATGAAATAAT TAAGTTACTC 
GCCAGGAGGC TAACCATAGC CGAAACCATA GGTGATGTTA AGAGGAAGCT TAATCTACCA 
CCCGTGGATC ATGAGAGGGA GAGTGAAGTT ATTGATAGAT GGGTCAGTGG CTTAGTTGAG 
GCTGGTTTAG ATGAATTAAC AGCCAGAAGC ATTGCTGAGC TAGTGATAAA GGCATCCACC 
AAGAGGCAGA TTAGGAATTG GTTTAACGTT AAAGTCACTA TAGTGGGTTC AGGGAGATTA 
GGTAAGACGC TTAAGAGGGC TTTAAGCCAA GTCACTCCAA CAACCTTAAT TAGCATGAGG 
GATGAATTAC CTGACTCAGA CATAGTAATA CTTGCCACAA GACCCACTGA GGACTCCATT 
AACTACATTA AGAGGAATAG TGAGAGCATA AGGGGTAGGG TGCTCATGGA TTCCTTCTCG 
GTTAAGTCAA GGTTATTCAA CATCATTGAG GATGAGTCAA GGGAAGTAGG CTTCAAGTAC 
CTGAGCATAC ACCCATTGTT CGGTAGCCTA ACGGATACTT GGGGTGAAGT AGTAGTCCTA 
ATACCATCAT TAACAAGTAG GGATTCACTA CCAATGGCTA CTCAGATATT TGAGGCAGCA 
GGCTTAAGAA CAGTGGTGTT AAGTGATCCT GATACTCATG ATAAGGTAAT GGCTTACATA 
CAGGTTGCCC ACCATTTAAT GCTACTAGCC CTCTATACCA TGCTTAAGGA TGCTGGTAAA 
GTAGGTGGGA TTGATGCAAA CCTACTTATG ACCCACAGCT TGAGGTTAAC CATGAAGGCT 
ATTGAAAGAA CCCTGGAGCA GCTTGATGTT GTTGAGGAGA TTCAGGAAAT GAATCCATAC 
GCCAGTGAAG TTAGGGATAA GATTACCAAG TACATTAACA TTGTTAATTC AGCAGCAGCT 
GAAGGTAAAT TAAGTGAGTT AATTGGAGGT GACTTAAAGT GA

Protein sequence

MLWQLRKSID EVDDEIIKLL ARRLTIAETI GDVKRKLNLP PVDHERESEV IDRWVSGLVE 
AGLDELTARS IAELVIKAST KRQIRNWFNV KVTIVGSGRL GKTLKRALSQ VTPTTLISMR 
DELPDSDIVI LATRPTEDSI NYIKRNSESI RGRVLMDSFS VKSRLFNIIE DESREVGFKY 
LSIHPLFGSL TDTWGEVVVL IPSLTSRDSL PMATQIFEAA GLRTVVLSDP DTHDKVMAYI 
QVAHHLMLLA LYTMLKDAGK VGGIDANLLM THSLRLTMKA IERTLEQLDV VEEIQEMNPY 
ASEVRDKITK YINIVNSAAA EGKLSELIGG DLK