Gene CA2559_08166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CA2559_08166
Symbol
ID	9297117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Croceibacter atlanticus HTCC2559
Kingdom	Bacteria
Replicon accession	NC_014230
Strand	+
Start bp	1788520
End bp	1789923
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	34%
IMG OID
Product	UDP-3-O-[3-hydroxymyristoyl] N-acetylglucosamine deacetylase
Protein accession	YP_003716380
Protein GI	298208201
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGAAA CCATTGCTCA AAAGCAACAG ACCATAGCTA AAGAAGTTAC TCTTAAAGGA 
GTAGGTCTTC ACACTGGTAA AGAAGTAACA TTAACTTTTA AGCCGGCACC CGAAAATTTT 
GGATACGCTT TTAAACGTGT TGATCTTGAA GGAGAACCTG TTATAGAGGC AGATGCCAAT 
TACGTGGTAA ACACTCAACG AGGAACTAAC CTTGAGAAAA ACGGCGTTAG CATACAGACA 
AGTGAACACG TACTTGCTGC TTGTGTAGGC TTAGAGATAG ATAATGTTTT AATTGAATTA 
AATGCATCTG AGCCTCCAAT TATGGATGGG TCTTCAAAAT TCTTTGTTGA AGCTTTAGAA 
AAAGCAGGAA TACAAGAACA AGAAAAGAAT AGAGAAGTTT ATGTTGTTAA AGAAAACATC 
TCTTATATCG ATGAAGAAAC TGGTAGCGAG ATACTTTTAA TGCCTTCAGA CGATTACCAA 
ATTACCACAA TGGTAGATTT TGGTACTAAG ATTTTAGGAA CCCAAAATGC TTCAATAAAA 
AATCTTTCAG AATTTAAAGA TGAAATATCA GACGCACGTA CATTTAGTTT CCTTCATGAA 
TTAGAAATGC TTTTAGAACA CGGCTTAATA AAAGGTGGTG ATCTAAATAA TGCAATTGTT 
TATGTAGATA AAGAGATAAG CTCAGATACT GTCGAAAAAT TAAAGAAAGC ATTTAATAAA 
GAAACAATCT CTGTTAAACC TAATGGTATA TTAGATAACC TAACGTTACA TTATCCTAAT 
GAAGCAGCAC GTCATAAACT ATTAGATGTA ATAGGAGATT TAGCGTTGGT AGGTACAAGA 
ATACAAGGTA AAATTATTGC CAATAAACCA GGACACTTTG TAAATACTCA ATTTGCTAAA 
AAACTATCTA AAATTATCAA GATAGAAAAA CGTAATGCAG TTCCTCAGGT AGATTTAAAT 
CAAAAACCAT TGATGGATGT TGTGCAAATC ATGAAAATGT TACCGCACAG ACAACCATTT 
TTATTAATAG ATAAGATTTT TGAGTTATCT GATACACATG TATTAGGATC AAAAAATGTA 
ACCATGAATG AAGACTTTTT TAGAGGTCAC TTTCCTGGTT CACCTGTAAT GCCAGGTGTC 
CTAATTGTTG AGGCAATGGC ACAAACCGGA GGCATATTAA TATTGAGTAC CGTTCCAGAT 
CCAGAAAATT ACTTAACCTA CTTCATGAAG ATAGATAATG TTAAGTTTAA ACAAATGGTC 
GTACCTGGAG ATACATTAGT CTTTAAGTGT GATTTAATAT CACCTATACG ACGAGGCATT 
TGTCATATGC AAGGTTACGC CTATGCAAAC GGCAAATTAG CTTGTGAAGC CGAACTTATG 
GCACAAATTT CAAAAGTAAA GTAA

Protein sequence

MTETIAQKQQ TIAKEVTLKG VGLHTGKEVT LTFKPAPENF GYAFKRVDLE GEPVIEADAN 
YVVNTQRGTN LEKNGVSIQT SEHVLAACVG LEIDNVLIEL NASEPPIMDG SSKFFVEALE 
KAGIQEQEKN REVYVVKENI SYIDEETGSE ILLMPSDDYQ ITTMVDFGTK ILGTQNASIK 
NLSEFKDEIS DARTFSFLHE LEMLLEHGLI KGGDLNNAIV YVDKEISSDT VEKLKKAFNK 
ETISVKPNGI LDNLTLHYPN EAARHKLLDV IGDLALVGTR IQGKIIANKP GHFVNTQFAK 
KLSKIIKIEK RNAVPQVDLN QKPLMDVVQI MKMLPHRQPF LLIDKIFELS DTHVLGSKNV 
TMNEDFFRGH FPGSPVMPGV LIVEAMAQTG GILILSTVPD PENYLTYFMK IDNVKFKQMV 
VPGDTLVFKC DLISPIRRGI CHMQGYAYAN GKLACEAELM AQISKVK