Gene Acid345_3499 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3499
Symbol
ID	4072757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4127145
End bp	4128338
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	59%
IMG OID	637985521
Product	glycosyl transferase, group 1
Protein accession	YP_592574
Protein GI	94970526
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCGCG TCGTTTTTCT CGCTCCGTAC GTCAAACACT ATCGCTTGCC TTTCTTCGAT 
CTGCTACACG CCGTGCTACA GAGTGACGGC ATCGAGATGC GCGTACTCTA CGGGCATCCG 
AACTCGCTTC ATGAAGCGCG CAAGGACAAT GCGGTGCCGC CGGACTCTTA TGGCCGGCCG 
GTGAAGAGCT ACTGGATTGC CGACCGGTTT GTGTATCAAG CAGCGTGGCG GGAGATCAGC 
GAGGCGGACC TGGTCATCAC TCCGGCAGAA AACAAAATGC TGTTGAACCC GATGCTGATT 
GCTCTGCGTT CGGCAGGAGT GAAACGCGTC GCATTCTGGG GAAAAGGCGA CATCCAACCT 
GCCAGGCTTT CGCAGCCGGA CCGATGGCTG CGACACCGGC TGGCCGCGAC CGTGGACTGG 
TGGTTCGCAT ACACACCACA GTCGGCGCAG AACCTGCGCA AGAACGGTGT GAGCTGCGGC 
ATCACGCCGG TGGGAAACAC GATTGATACT GCGGAACTAC AACGAGAGTG CGACGCGATC 
TGCTCGGCAT GCGTGCAGGA GGCGCGCGTC GGAATGGACA TCCGGCCGGG GCCAGTCGGC 
ATTTATTGTG GCAATTTGAG CCGGAACAAG CACCTCGATT TTCTCTTCGC AGCCGCGAGG 
CGGATTGCAC AGGAGATCCC CGAGTTTACC CTTCTCGTAG TTGGGAATGG TCCGCTACGG 
AATCAGGTGG AACTGGTCGC CGTACATGAG CGATTCGTCC ATTATGTTGG CCCGCGGATA 
GGTCGAGAAA AAGCGCTTTT GTTGAAGATG GCGGATGTTT TCCTCCTTCC GGGTGCAGTC 
GGTCTGGCGA TCCTCGATGC GTTCGCGGCA CAACTTCCGC TGATTACAAC GGCACTTCCG 
GACCACGGTC CGGAGATCAG CTATCTCACT CCGGGAAAGA ACGGCCTCAT CACGGCGCAC 
GAGGAGCAGG CGTATGCGTC GGCTGTAGTT TCACTACTGA AGGCCCGGTC CCGACTTGTG 
GCGATGAGCC AGGCCGCGCG GATCGGCGCG GAAGAGCACA CCATGGAAAC AATGGTCCGA 
AACTTCCGTC GCGGCATCCT GGAATGCCTT GGATTGCCAG TGGTGGACTC GAAAATAGAG 
TCGCGGCGCG AGTCTCTCGC CAAATTGCAG TTCGTTCCAA ATGGAAGAAC GTAA

Protein sequence

MRRVVFLAPY VKHYRLPFFD LLHAVLQSDG IEMRVLYGHP NSLHEARKDN AVPPDSYGRP 
VKSYWIADRF VYQAAWREIS EADLVITPAE NKMLLNPMLI ALRSAGVKRV AFWGKGDIQP 
ARLSQPDRWL RHRLAATVDW WFAYTPQSAQ NLRKNGVSCG ITPVGNTIDT AELQRECDAI 
CSACVQEARV GMDIRPGPVG IYCGNLSRNK HLDFLFAAAR RIAQEIPEFT LLVVGNGPLR 
NQVELVAVHE RFVHYVGPRI GREKALLLKM ADVFLLPGAV GLAILDAFAA QLPLITTALP 
DHGPEISYLT PGKNGLITAH EEQAYASAVV SLLKARSRLV AMSQAARIGA EEHTMETMVR 
NFRRGILECL GLPVVDSKIE SRRESLAKLQ FVPNGRT