Gene Nmag_2477 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_2477
Symbol
ID	8825330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	2537039
End bp	2538205
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	67%
IMG OID
Product	3-ketoacyl-CoA thiolase
Protein accession	YP_003480599
Protein GI	289582133
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGGCG TACGCGTCGC CGGAACGGGG TTGACACCGT TCGGAAACGC CCCCGAACGG 
ACGAGCAGAG ACCTCTTTGC CGAAGCGACA CAGACCGCGT TCGAAGAGAG CGGCGTTCCA 
CGAGCGGACG TCGAAGCAGT GTTCTACGGA AACTTCATGG GCGAACTGGC AGAGCACCAG 
GGCCATCAGG GGCCGCTGAT GGCCGAAGCC GCTGGCGTTC AGGCTCCAGC GACACGGTAC 
GAATCGGCCT GCGCCTCGAG CGGGATGGCA GTTCGTGATG CCGTGATGCG CGTCCGAAAC 
GGCGAACATG ACGTTGTCCT TGTCGGTGGC GCAGAGCGAA TGACCAACCT CGGCACCGCC 
GGCGCGACGG AAGCGCTCGC CATCGCTGCC GACGACCTCT GGGAGGTGCG AGCCGGAATG 
ACCTTCCCCG GCGCGTACGC GCTGATGGCC CAGGCGTACT TCGAAGAGTT CGGCGGCGGC 
CGCGAGGACC TGGCCAACGT CGCGGTCAAG AACCACGACA ACGCGCTGAC CAACGAGAAG 
GCCCAGTACC AGACGGCAAT CTCTGTCGAG GAGGCCCTCG ACGCCCCGAC CGTCTCGAGT 
CCACTCGGAC TCTACGACTC GTGTCCCCTC TCGGACGGCG CGGCGGCGCT CGTCCTCACG 
AGCGAGGAGT ACGCTGACGA ACACGACCTC GACGCACCGG TTGCCATCAC CGGCACCGGG 
CAGGGCGGCG ACCGGATGGC GCTCCACGAC CGCGAGCACC TCGCGCGCTC ACCCGCCGCT 
CGTGAGGCCG GTACAGAGGC GTACGCGGAC GCCGGCGTCG ACGCCAGCGA CGTAGACCTC 
GCCGAGGTCC ACGACTGCTT TACGATCGCC GAAGTGCTCG CCATCGAGGC GCTCGATCTC 
GCCCAGATCG GCGAGGGAAT CTCGGCTGCC CGCGACGGGC GGACGACCGC AGACGGCGAC 
GTTCCGATCA ACCTCTCGGG CGGGCTCAAG GCGAAGGGCC ACCCGGTCGG TGCGACCGGC 
GCGTCACAGA TTGCCGAGGT CACGAAGCTA CTGGCGGGGA CGCACCCGAA CAGCGAGCAC 
GTCGCAGATG CGACGACTGG TCTCGCCCAC AACGCGGGTG GAACGGTCGC CAGTGCGACG 
GTTCACGTAC TGGAGGTGAT GGAGTAA

Protein sequence

MSGVRVAGTG LTPFGNAPER TSRDLFAEAT QTAFEESGVP RADVEAVFYG NFMGELAEHQ 
GHQGPLMAEA AGVQAPATRY ESACASSGMA VRDAVMRVRN GEHDVVLVGG AERMTNLGTA 
GATEALAIAA DDLWEVRAGM TFPGAYALMA QAYFEEFGGG REDLANVAVK NHDNALTNEK 
AQYQTAISVE EALDAPTVSS PLGLYDSCPL SDGAAALVLT SEEYADEHDL DAPVAITGTG 
QGGDRMALHD REHLARSPAA REAGTEAYAD AGVDASDVDL AEVHDCFTIA EVLAIEALDL 
AQIGEGISAA RDGRTTADGD VPINLSGGLK AKGHPVGATG ASQIAEVTKL LAGTHPNSEH 
VADATTGLAH NAGGTVASAT VHVLEVME