Gene Acid345_3807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3807
Symbol
ID	4071091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4500115
End bp	4501596
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	55%
IMG OID	637985830
Product	undecaprenyl-phosphate galactosephosphotransferase
Protein accession	YP_592881
Protein GI	94970833
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.27586
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.25829
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACAT CGGCGACTCC AGGACGTTCT TCTCCGCAAA CCAAACCTCC CATACCCCGG 
GACCTCAGTT CTCGGTTGGA AGCACCTCGG GCGAGGCACG GGAACGCGCT AAAAGTTGTA 
ATCGAAGTCC TGGAGCGCCT TTTTGATGCG GTCGCTGTGT TCACCGGGAC CGTTCTGGCA 
TACAACGTTT ACCGATTGGT TGGACTCGGT CGGAGGGTCG AGTATCCAGT CGGTTGGCTG 
ACAACTGCTG CGATTGCGTT TTCGGTCGTG TTCATTTTGT TGCTGGAACA CCTGGGTGAG 
TATCGTTCCG GGAGCCTTCT CGGTGTGCGT GAGACCGAAC GAGTCCTGCG CGCTGCTTGG 
TACTCTGTTT TTCTCGTTTT CCCAATCGCT TTTTTTTCGG GGCGGTCTTA CTCAAGACTT 
GTGGTTTTGT TCGTGGCGGC AGTCGTTCCG ATCTGTGTCC TTATCGTCCG ACAGTTTTCG 
TTCCGAGTGA TTGAGCGGCT TTGTATCGCC GGAGATCTCT TGCGACCGGC GGCCATTTAC 
GGGAGCGGCA GATCCGCGAG GAAGGTTTAC TCGGCGCTGC TGCGCTCGCC GAAACTCGGG 
CTGAAGCCGG TGGCATTCCT CGATGAGAAG GAGACGGATC GGTCAAAGCA TGTGTTCGAG 
GCCTCGTATC ACCGAAAGAA CAGTGCGCAA GTGATCGCGA TGCCGATCAC GATCGAGTTG 
CTCAAGGACT TGCAGATCAG CAGCCTCGTG CTTTGCGAAT TACCGCCGGC TTCCAAACTT 
TCAGTCGTCG AAGAGTGCTG CCGACAGGCT GGCGTAGAGG TTTATCTGTC GCCAGGCCTG 
ATGCATTCTG AAGATCAATC CATTGAATTC GTTGACATTG ACGGAATGTT GTTCGCTCGC 
ACTGCGGGAG TGAACCATGT ATCGCTATAT GATTTGTTCA AGCGTGTCTT CGATGTGCTG 
GCGGCCGGAG TTATCACGCT GGTGATATCG CCGATCCTCC TCGCGATTGC CCTCGCGGTT 
AAGTTTTCGT CTCGCGGCAA AATACTATTT GTGCAAGAGC GAGTCGGGCG CGGCGGTACG 
CAGTTCGCAA TGTACAAGTT TAGGTCGATG CATGCCGATG CACCGAAATA TGCGTTTTCG 
CCACGTGAGG TAGAAGATCC GCGCATCACG CTCATTGGGC GTTTCTTGCG GCGCACAAGC 
CTCGATGAAT TGCCTCAACT ATTTAATGTA ATTCGGGGCG AGATGTCGCT GGTGGGGCCA 
CGACCAGAAA TGCCGTTCAT CGTGGAGAGG TACACCCCGC AGCAGCGACG AAGATTAGAT 
GTGAAGCCGG GAATCACAGG CTTGTGGCAA CTCAGCGCCG ATCGCGCTTA CCTGATTCAC 
GAGAACATCG AGTACGATCT TTACTACGTT AGGAACCGAA ACTTTTTCCT GGACCTCGCG 
GTTCTAGTCC ATACGGCAGT TTTTGCAGCC CGGGGAGTCT GA

Protein sequence

MATSATPGRS SPQTKPPIPR DLSSRLEAPR ARHGNALKVV IEVLERLFDA VAVFTGTVLA 
YNVYRLVGLG RRVEYPVGWL TTAAIAFSVV FILLLEHLGE YRSGSLLGVR ETERVLRAAW 
YSVFLVFPIA FFSGRSYSRL VVLFVAAVVP ICVLIVRQFS FRVIERLCIA GDLLRPAAIY 
GSGRSARKVY SALLRSPKLG LKPVAFLDEK ETDRSKHVFE ASYHRKNSAQ VIAMPITIEL 
LKDLQISSLV LCELPPASKL SVVEECCRQA GVEVYLSPGL MHSEDQSIEF VDIDGMLFAR 
TAGVNHVSLY DLFKRVFDVL AAGVITLVIS PILLAIALAV KFSSRGKILF VQERVGRGGT 
QFAMYKFRSM HADAPKYAFS PREVEDPRIT LIGRFLRRTS LDELPQLFNV IRGEMSLVGP 
RPEMPFIVER YTPQQRRRLD VKPGITGLWQ LSADRAYLIH ENIEYDLYYV RNRNFFLDLA 
VLVHTAVFAA RGV