Gene Acid345_4719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4719
Symbol
ID	4070657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5582414
End bp	5583382
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	60%
IMG OID	637986763
Product	lipid-A-disaccharide synthase
Protein accession	YP_593792
Protein GI	94971744
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1663] Tetraacyldisaccharide-1-P 4'-kinase
TIGRFAM ID	[TIGR00682] tetraacyldisaccharide 4'-kinase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCCAC TGTCGGCGCT CTTCGGCGCA GGCGTCGCGA CGCGAAATGC GATGTTTGAC 
CGCAGCTTGC TGAAGCAGCA GCGACTGCGC GGGCCGGTGG TGAGTGTGGG GAATTTGTGC 
GTCGGGGGAA CGGGGAAAAC GCCTTTCACG CAACTGCTCG GCGACTTGCT GATGCAGCGC 
GAGATTGACT TCGACGTGCT CTCACGGGGC TACGGGCGGG AATCAACCGA AATTAAAATT 
GTCGAGCTGG ATGGTTCCCC AAACGAATTC GGCGATGAGC CTCTGCTGCT AGCAAAGTAC 
TTTGCGGCGA AGAAGCCAGA GAATCCGCCG CGAGTGATTG TCGGGGCCGA CCGTTACGAA 
GCGGGGCGAT TTGCTGAGCA GAAATTCGGG CCGCGCCTGC ACCTGCTGGA CGATGGCTTC 
CAGCATCGCG GATTGGCCAG GGACTTCGAC ATTGTGCTGC TCGCGCCGGA CGATGCCGAC 
CAGGTGCTTC TGCCGGTTGG GCGTTTGCGA GAACCTCTGA CCGCACTGAA GCGCGCCCAC 
GCGGTGGTTG CGACTGACGA GGTCAAGATA GAGGCGTTCC CGGTGATGCC GCCACTTGTG 
TGGCGTGTGG AACGTGACAT CGCTCTGCCG GAGCAACTCA GTCGGAACGC CCGAGTGCTG 
GCGTTTTGTG CCATAGCGCG GCCGCATCGC TTCTTCACCG ACCTGCGGCG TCACGGTCTG 
GAGCCAGTGG CTGAGCTGAC ATTCCGCGAC CATCACCGCT ACTCAGCGGC CGACATCGAG 
AAAATCGTTC GTGAAATTTC CAGCAGCCGA GCCGATTGCT GCGTAACGAC CATCAAAGAC 
ATGATGAATC TCGGCGAGTT GGTGCACCGG TTAGCGCCGA TCTACGCTGT GCGGCTCTCG 
CTGAAACTTA GAGATGCGGA CGCGGCACTC GACGAGATCA TCAAGATCAT TGAACGACGG 
CAAGGCTGA

Protein sequence

MNPLSALFGA GVATRNAMFD RSLLKQQRLR GPVVSVGNLC VGGTGKTPFT QLLGDLLMQR 
EIDFDVLSRG YGRESTEIKI VELDGSPNEF GDEPLLLAKY FAAKKPENPP RVIVGADRYE 
AGRFAEQKFG PRLHLLDDGF QHRGLARDFD IVLLAPDDAD QVLLPVGRLR EPLTALKRAH 
AVVATDEVKI EAFPVMPPLV WRVERDIALP EQLSRNARVL AFCAIARPHR FFTDLRRHGL 
EPVAELTFRD HHRYSAADIE KIVREISSSR ADCCVTTIKD MMNLGELVHR LAPIYAVRLS 
LKLRDADAAL DEIIKIIERR QG