Gene Nmag_2387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_2387
Symbol
ID	8825239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	2432037
End bp	2433188
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	66%
IMG OID
Product	chorismate synthase
Protein accession	YP_003480510
Protein GI	289582044
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGGCA ATCGGTTCGG TCGCCTCTTT CAGGTGACCA CGTTCGGTGA GAGCCACGGC 
GAGGCGATGG GGTGTACCAT CTCCGGCTGC CCCGCCGGCC TCGAGCTCTC CGAGGAGGAT 
ATTCAGGCCG ACCTGGACCG GCGCAAGCCG GGTCAGTCGA TGATCACGAC CAGCCGCGGC 
GAACCCGACG ATGTCTCGAT CAAGTCCGGG ATTCAGGACG GCTACACCAC CGGCACACCA 
ATCGGGCTCG TGATCCAGAA CAAGGACGCG CGCTCGGGCA AGTACGAGCC CTTCATCACC 
GCGCCGCGGC CGTCGCACGG GGACTTTACG TACTCAGCAA AGTTCGGCAC GCGAAACTGG 
GGCGGCGGCG GCCGCTCCTC GGCGCGGGAG ACGGTCAACT GGGTCGCAGC GGGTGCAATC 
GCGAAGAAGT TGCTCGCCCG CGAGGGCATC GAACTCAAGG CCCACGTCAA CCAGATCGGC 
GATATCGAAG CGCCCGAGGT CAGCTTCGAG GAGATGCTAG AGCACTCCGA GGAGAACGAC 
GTGCGCTGTG CACACCCCGA GACGGCCGCC GAAATGCAGG AACTGATCGA GGAGTACCAG 
GAGGAGGGCG ACTCGATCGG CGGTTCGATC TACTTCGAGG CGCAGGGAGT CCCCGTCGGA 
CTCGGCGCGC CCCGCTTTGA CTCGCTCTCG GCGCGACTCG GGCAGGCGAT GATGGCAGTG 
CCGGCGACGA CGGCGTTCGA GTTCGGCCTC GGAACAGAGG CCGCGGAGTG GACCGGAAAG 
GAGCGAAACG ACGACTGGGA GTTCGATTCG GACGGGGATC CGACGCCCGT CGAGAACGAC 
CACGGCGGCA TCCAGGGCGG CATTAGCTCG GGCGAACCGA TCTACGGCGA GGTCACCCTC 
CACGCACCGA CCTCGATTCC GAAAAGCCAG CAGACTGCCG ACTGGGAGAC CGGCGAACTG 
AAAGAGGAGA AGGTCATCGG TCGGCACGAC CCCGTTCTCC CGCCCCGTGG CGTGCCGGTC 
GTCGAGGCGA TGCTCGCGCT GACGCTGGTC GACTTCATGC TGCTCTCGGG TCGGCTCAAT 
CCCGACCGCG TCGACGACCA GCCCGGCGAG TACGACACCG ACTACCATCC GAGCAACCCG 
CAAAACGAGT AG

Protein sequence

MNGNRFGRLF QVTTFGESHG EAMGCTISGC PAGLELSEED IQADLDRRKP GQSMITTSRG 
EPDDVSIKSG IQDGYTTGTP IGLVIQNKDA RSGKYEPFIT APRPSHGDFT YSAKFGTRNW 
GGGGRSSARE TVNWVAAGAI AKKLLAREGI ELKAHVNQIG DIEAPEVSFE EMLEHSEEND 
VRCAHPETAA EMQELIEEYQ EEGDSIGGSI YFEAQGVPVG LGAPRFDSLS ARLGQAMMAV 
PATTAFEFGL GTEAAEWTGK ERNDDWEFDS DGDPTPVEND HGGIQGGISS GEPIYGEVTL 
HAPTSIPKSQ QTADWETGEL KEEKVIGRHD PVLPPRGVPV VEAMLALTLV DFMLLSGRLN 
PDRVDDQPGE YDTDYHPSNP QNE