Gene Htur_1434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_1434
Symbol
ID	8742025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	+
Start bp	1489871
End bp	1491022
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	67%
IMG OID	646512012
Product	chorismate synthase
Protein accession	YP_003402995
Protein GI	284164716
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGGCA ACCGCTTCGG TCGCCTCTTC CAGGTGACCA CGTTCGGCGA GAGCCACGGG 
GAGGCGATGG GCTGTACCAT CTCGGGCTGT CCCGCCGGCC TCGAGCTCTC GGAGGAGGAC 
ATCCAGGAGG ACTTAGATCG GCGAAAGCCG GGCCAGTCGA TGATCACGAC CAGCCGCGGC 
GAACCCGACG ACGTCTCGAT CAAGTCCGGG ATTCAGGACG GCTACACGAC CGGGACGCCG 
ATCGGGCTGG TCATCCAGAA CAAGGACGCT CGTTCAGGCA AGTACGAGCC GTTCATCACC 
GCACCCCGTC CGTCCCACGG CGACTTCACC TACTCGGCGA AGTTCGGTAC CCGTAACTGG 
GGCGGCGGCG GCCGCTCGTC GGCCCGCGAG ACCGTCAACT GGGTCGCCGC GGGCGCGATC 
GCAAAGAAGC TCCTCGCGCG CGAGGGAATC GAACTCAAGG CCCACGTCAA CCAGATCGGC 
GACGTCGAGG CCCCCGAGGT AAGCTTCGAG CAGATTAAGG AACACTCCGA GGAGAACGAC 
GTCCGCTGTG CCGATCCCGA GACCGCCGCG GAGATGCAGG AACTCATCGA GGAGTACCAG 
GAGGAAGGCG ACTCCATCGG CGGCTCGATC TACTTCGAGG CCCAGGGCGT CCCCGTCGGC 
CTCGGCGCAC CTCGGTTCGA CTCGCTGTCC GCGCGACTCG GACAGGCCAT GATGGCGGTC 
CCGGCGACGA CGGCCTTCGA GTTCGGCCTC GGTCGCGAGG CCCGCGAGTG GACGGGCAAG 
GAGCGAAACG ACGACTGGGA GTTCGACGAC GAGGGGAACC CGACGCCCGT CGAGAACGAC 
CACGGCGGCA TCCAGGGCGG CATCTCGAGC GGCGAACCGA TCTACGGCGA GGTCACGCTC 
CACGCACCTA CGTCGATCCC CAAGTCCCAG CAGACCGCCG ACTGGGAGAC CGGCGAAATC 
AAGGAAGAGA AGGTTATCGG CCGCCACGAC CCCGTCCTCC CGCCGCGAGG CGTCCCGGTC 
GTCGAGGCGA TGCTCGCGCT GACGCTCGTC GACTTCATGC TGCTGTCGGG CCGGCTCAAC 
CCCGACCGCG TCGACGACCA GCCCGGCGAG TACGACACGG ACTACCACCC GAGCAACCCG 
CAGAACGAGT GA

Protein sequence

MNGNRFGRLF QVTTFGESHG EAMGCTISGC PAGLELSEED IQEDLDRRKP GQSMITTSRG 
EPDDVSIKSG IQDGYTTGTP IGLVIQNKDA RSGKYEPFIT APRPSHGDFT YSAKFGTRNW 
GGGGRSSARE TVNWVAAGAI AKKLLAREGI ELKAHVNQIG DVEAPEVSFE QIKEHSEEND 
VRCADPETAA EMQELIEEYQ EEGDSIGGSI YFEAQGVPVG LGAPRFDSLS ARLGQAMMAV 
PATTAFEFGL GREAREWTGK ERNDDWEFDD EGNPTPVEND HGGIQGGISS GEPIYGEVTL 
HAPTSIPKSQ QTADWETGEI KEEKVIGRHD PVLPPRGVPV VEAMLALTLV DFMLLSGRLN 
PDRVDDQPGE YDTDYHPSNP QNE