Gene Hmuk_2640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2640
Symbol
ID	8412190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	2530689
End bp	2531936
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	67%
IMG OID	645020985
Product	chorismate synthase
Protein accession	YP_003178453
Protein GI	257388680
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGGGA ACGAGTTCGG TCGGCTCTTT CGGCTGACCA CCTTCGGCGA GAGCCACGGG 
GATGCGATGG GTTGTACGGT TTCAGGTGTG CCGGCGGGCG TCGAACTGTC CGAGGAAGCG 
ATTCAGGAAG ATCTCGACCG GCGCAAGCCC GGTCAGTCGA TGATCACGAC CTCGCGGGGC 
GAGCCCGACA AGGTGTCGAT CAAGTCCGGA CTGCAGGACG GCTACACGAC GGGAACGCCG 
ATCGGCATGG TCATCCAGAA CAAAGACGCC CGATCGGGGA AGTACGAGCC CTTCATCACG 
GCACCGCGGC CCTCTCACGG CGACTACACC TACTCGGCGA AGTTCGGCAC GCGCAACTGG 
GGCGGTGGCG GCCGCTCGTC GGCCCGCGAG ACGGTCAACT GGGTCGCTGC CGGCGGCGTC 
GCCAAGCAGG TCCTCGCACA GTCTGACTAC GACGTGCAGA TCAAGGCTCA CGTCTGCCAG 
ATCGGCGACG TGGTTGCCGA CGACGTGACC TGGGAGGAGA TGCTCGAACA CAGCGAGGAC 
AACGAAGTCC GCTGTGGCGA TCCCGACGCC GCCGAGGAGA TGCGCGACCT CGCGGACGAG 
TACCAGAAGG AGGGCGACTC GATCGGCGGC GCGATCTACT TCGAGTGTCG CGGCGTTCCG 
CGGGGCCTCG GTGCGCCGCG GTTCGATTCG ATACCCGCAC GCCTCGGGCA GGCGATGTAC 
TCCATCCCCG CAGTCACGGA CTTCGAGCTG GGGATCGGGC GCGATGCTCG GACGGCCACC 
GGGACCGACT ACACCGAAGA CTGGGAGTTC GGCGAGAGCG AGGCGACAGC CTCGGAAAAC 
GCGAGCGGCG ACGAGCCGCG AGCGAGAGGC GACCCGAAGC CAGTCGGCAA CGACCACGGC 
GGCATCCAGG GCGGGATCAC GACCGGCGAC CCGATCTACG GCGAGGTCAC CTGGCACGCG 
CCGGTCTCGT TCCCGAAGAC CCAGGAGACC GTCGACTGGG AGACCGGCGA GAGAAAGGAG 
ATAACGGTGA CGGGGCGACA CGACCCCGTC CTCCCGCCGC GGGCGGTCCC CGTCGTCGAA 
GCGATGCTGT ACTGTACGGT GCTGGACTTC ATGCTGCTCG GTGGCCGGAT CAACCCGGAC 
CGGCTCGACG ACCGGCCCGG CGAGTACGAC ACCGACTACC ACCCGTCGAG CCCGCGGAAC 
GATCCCGAAG ACGCCGACAC GCACGCGACG ACCGTCGACG AGGACTGA

Protein sequence

MNGNEFGRLF RLTTFGESHG DAMGCTVSGV PAGVELSEEA IQEDLDRRKP GQSMITTSRG 
EPDKVSIKSG LQDGYTTGTP IGMVIQNKDA RSGKYEPFIT APRPSHGDYT YSAKFGTRNW 
GGGGRSSARE TVNWVAAGGV AKQVLAQSDY DVQIKAHVCQ IGDVVADDVT WEEMLEHSED 
NEVRCGDPDA AEEMRDLADE YQKEGDSIGG AIYFECRGVP RGLGAPRFDS IPARLGQAMY 
SIPAVTDFEL GIGRDARTAT GTDYTEDWEF GESEATASEN ASGDEPRARG DPKPVGNDHG 
GIQGGITTGD PIYGEVTWHA PVSFPKTQET VDWETGERKE ITVTGRHDPV LPPRAVPVVE 
AMLYCTVLDF MLLGGRINPD RLDDRPGEYD TDYHPSSPRN DPEDADTHAT TVDED