Gene Acid345_1935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1935
Symbol
ID	4071411
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2328032
End bp	2329045
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	61%
IMG OID	637983947
Product	UDP-3-O-[3-hydroxymyristoyl] glucosamine N-acyltransferase
Protein accession	YP_591010
Protein GI	94968962
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1044] UDP-3-O-[3-hydroxymyristoyl] glucosamine N-acyltransferase
TIGRFAM ID	[TIGR01853] UDP-3-O-[3-hydroxymyristoyl] glucosamine N-acyltransferase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.920136
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTCT CCGAGATCGC CCGCCGCCTC GGCTGCACCC TCGACAACTG TCCCGACCCT 
GACGCGGTTG AGATCACCGC CGTCACCGGC ATCGAAGCAG CCGGGCCCAC AGATATCACC 
TTCGTCTCGA ACCCGCGCTA CGCTGCGGCC GCGAAGACAA CGCACGCCGG CGCGATCATC 
GTCTCCGACG ACTTCACCGC CGGTCGCGCG CCGCTCGTCC GCAGCAAGAA TCCGTACCTC 
ACGTTCGCGA AGGCGATCGA GCTCTTCTAC CAAGCGCCAA AGTACGCTCC GGGCATTCAC 
CCCACCGCGG TCATCTCTCC CACGGCGAAG GTGGGCGCGA ACGCTTCGAT TGGCCCTTAC 
GTGGTGATTG AGGACAACGT TGCCATCGGC GCGAATTGCG TTCTTCGCGC GCACGTCGTC 
ATCTACGAAG GCGTGACTAT TGGCGACAAT TTCTTCGCGC ACGCGCACGC GGTTGTCCGC 
GAGCACTGCC GCATTGGCAA CAACGTCATC CTGCAGAACG GCGTGGTAAT TGGCGCCGAC 
GGCTACGGCT TCGCCCGCGA CACCGACGGC TGGTACAAGA TCGCCCAATC TGGCACTACC 
ATCCTCGACG ACAACGTTGA AGTACAAGCC AACTCCACCG TCGACCGGGC CTCAATCGGC 
GAGACTCACA TCTATGCCGA CGCCAAGATC GACAACCTCG TAATGATCGG CCACGGCAGC 
TCCGTCGGCG AACATTCCCT GCTCTGCTCA CAGGTTGGAC TCGCCGGTTC CAGCCACGTC 
GGCAAAAACG TAATTCTTGC GGGTCAAGTC GGGGTCGCCG GACATCTACA CATTGGTGAC 
GGGGTAATCG CGGCCGGCCA AACCGGTGTG CAGAACGACA TCGAGCCCGG CAAACGCATT 
GGCGGCTCGC CGTCATACGA CCACAAGCAG TGGATCCGTT CCTGGCAAAT CCAGACGAGA 
TTGCCGGAAA TTGTGAAGGA ACTGCGAAAT CTTGCATCCA AGAAAAGTGA GTAG

Protein sequence

MKLSEIARRL GCTLDNCPDP DAVEITAVTG IEAAGPTDIT FVSNPRYAAA AKTTHAGAII 
VSDDFTAGRA PLVRSKNPYL TFAKAIELFY QAPKYAPGIH PTAVISPTAK VGANASIGPY 
VVIEDNVAIG ANCVLRAHVV IYEGVTIGDN FFAHAHAVVR EHCRIGNNVI LQNGVVIGAD 
GYGFARDTDG WYKIAQSGTT ILDDNVEVQA NSTVDRASIG ETHIYADAKI DNLVMIGHGS 
SVGEHSLLCS QVGLAGSSHV GKNVILAGQV GVAGHLHIGD GVIAAGQTGV QNDIEPGKRI 
GGSPSYDHKQ WIRSWQIQTR LPEIVKELRN LASKKSE