Gene Acid345_0723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0723
Symbol
ID	4069795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	885627
End bp	886784
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	59%
IMG OID	637982729
Product	ceramide glucosyltransferase, putative
Protein accession	YP_589802
Protein GI	94967754
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID	[TIGR03472] hopanoid biosynthesis associated glycosyl transferase protein HpnI

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTACG CGCACCTCAT CCTGGAAGCA CTGACCGTGA TTGGTGCGGT CAGCGGCACA 
GCGTATTACG CGCTGTGTTT ATGGGGTGCT GCGCGATTTA TCCGCGAGCG GCGCGCGGCA 
CAAAGCGAGG CGTTTACGCC GCCGGTGAGC ATATTGAAGC CGCTGAAGGG CGCGGACCCG 
AGCATGTACG AGGCGTTCCG CAGCCACTGC CTGCAAGATT ATCCCGAGTA CGAAATCGTC 
TTCGGTGTCG CGGACTTGCA CGATCCGGCG GCACAGGCTG TCGAGCGATT GCAGCAAGAA 
TTTCCGGAAC TCACGATCAA GTTGGTGCAG TGCTCTCCTT CGGGCGGCAC CAATCGAAAA 
GTTGCAACCT TGCAGGAGAT GCTACCGCAC GCGCGGTACC CGTACCTCCT GATCAACGAC 
AGTGACATTC GCGTAGGAAC TAATTACTTG CATGAAGTCA TGGGTCCGAT GCTGGACTCG 
AAGGTCGGCA TGGTGACGGC CCTGTATCGC GCGGCTCCCG GGAAGACACT CGGATCGAAG 
CTGGAAGCAA TTGGCATTGG AACCGACTTC ATGGGAGGGG TGCTGTCAGC CCGCGAGATT 
GAAGGTGGGC TTCACTTCGC GCTCGGCTCG ACACTGACTT TTCCACGCGA AGCCCTCGAA 
AAGATCGGCG GCTTCGCCCC TCTTCTTGAC TATCTCGCCG ACGACTACGA ACTGGGCGCG 
CGAATTTCGC AGGCCGGATA TCAAGTCGCG CTGGCACGTA CGATCGTCGA AACCCACCTA 
CCGGACTATT CGTGGCCAGC TTTCTGGAAG CACCAGTTGC GCTGGAACCG CACCATCCGC 
GACAAGCGCA AAGGCGGATA CTTCGGCGTG CTGTTGACCT TCGGCCTCCC GTGGGCATTG 
CTCACCGTGA TCGCGTCGCT GGGTGCGGGG TGGGCTTGGA TGCTCTTCCT TGCTGTCGTG 
GTGGCACGTT ATGCGCTGGC TTTGACGCTG ATGGGGCCGA TTCTTCACGA CCGTAGAGGT 
ACGGGCAATC TCTCGCTCGT GCCGCTCCGC GACTGCGTTG CGATGGTCCT ATGGTTCTGG 
ACGTATTTAG GCGACGAGAT CGAATGGCGC GGCGAAACCT TTCGCCTGCG CGATGGAAAA 
CTCATTCGAA TCGAATAG

Protein sequence

MHYAHLILEA LTVIGAVSGT AYYALCLWGA ARFIRERRAA QSEAFTPPVS ILKPLKGADP 
SMYEAFRSHC LQDYPEYEIV FGVADLHDPA AQAVERLQQE FPELTIKLVQ CSPSGGTNRK 
VATLQEMLPH ARYPYLLIND SDIRVGTNYL HEVMGPMLDS KVGMVTALYR AAPGKTLGSK 
LEAIGIGTDF MGGVLSAREI EGGLHFALGS TLTFPREALE KIGGFAPLLD YLADDYELGA 
RISQAGYQVA LARTIVETHL PDYSWPAFWK HQLRWNRTIR DKRKGGYFGV LLTFGLPWAL 
LTVIASLGAG WAWMLFLAVV VARYALALTL MGPILHDRRG TGNLSLVPLR DCVAMVLWFW 
TYLGDEIEWR GETFRLRDGK LIRIE