Gene Acid345_3362 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3362
Symbol
ID	4071280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3988710
End bp	3989978
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	57%
IMG OID	637985384
Product	N-glycosyltransferase
Protein accession	YP_592437
Protein GI	94970389
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATCCCGC TGGCTTACGA ATCGCTTCTC AAAGCCTTGC GCGCGGTAGA CCACACCGTG 
GTGTACGTGT ATGCGCTGCG GTTTTACGGC CTCTATCCGA TCCTGATGAG TTGGGTGTGG 
ATCTCGCTGT CGCTTTTCTT CCGTCGTCGA CAGGAAGATA CCGAAATGGA AATGTCGGGC 
CCTGCCCCGA TGGTCTCGAT TCTCGTACCC GCGTTTGCTG AAGCGGAGAC GATCGACGAC 
ACCATTGAAG CGCTTCTGAA GCTCGATTAT CCGAACTACG AAGTCATCCT CGTGAACGAT 
TGCTCACCGG ACAACACCGC CGAAGTCGTT CGCCAATATC TCGACGATCC GCGCATCAGG 
CTATTGAACA AGCAGGTGAA CGAAGGCAAG GCCATGGCTT TGAACGATGC GTTGCCGATG 
TGCCGCGGCG AGATTCTTGT GGTGATTGAC GCCGACATCA TCGTGTCGCG CGATCTTCTG 
AATTACATGG TGCCGCACTT TGCCGGCACG CGCGTGGCAG CCGTGACCGG CAATCCGCGG 
GTACGCAACC GGGTCTCGAT CCTGCAGCAC CTGCAGGCGG TGGAATTCTC TTCGATCGTC 
TCAATGCAGC GCCGTGCGCA ACGCGTATTG GGCCGCGTGT TGACCGTGTC TGGCGCGGTT 
TTCGCGGTTC GCCGCAGCGC TTTACTCGAG CTTGGTGGGT TCACACCGCA CATGGCGACC 
GAAGACATCG ACCTGACCTG GCGTTTGCAG ATGAAATTCT GGGATGTCCG TTACGAACCG 
CGCGCCGTGG TGTGGATGCA GGTGCCGCTC AGCTTGCGCG AGTTGTGGAA GCAGCGAAAG 
CGTTGGGCGC GCGGGCTCGT CCAGGTGCTC AAGCGCCATC GCGAAGTACC GACCAACTGG 
AAGATGCGTC GCATGTGGCC CATCTTTTAC GAATCGATCT TCTCGATCCT GTGGTCGTAC 
GTCTTCGTGC TGATGACCTC GTACTGGCTG ATTTCCTTGG CAGTTGGCTA CGCGCCACGA 
GGCGTATCGC CGTTCCCAAA TTTCTGGGGA ATGATGATCG CTACGACCTG TCTTTTGCAG 
CTATTCATTG GCGCGTGGGT TGACCGGCAG TACGACCCGG GAATTATGTG GTCGTTTCCG 
GAAGCAGTTT TCTATCCGGT CATTTATTGG ATGTTGATGG CACTGATTAC TTCGTTCTAC 
ACGATTCCGG CGTTGTTCAA GAAACCGCCG AGAGTACAGA CGTGGCGAAT TCGGCGGGGT 
CCTGCATGA

Protein sequence

MIPLAYESLL KALRAVDHTV VYVYALRFYG LYPILMSWVW ISLSLFFRRR QEDTEMEMSG 
PAPMVSILVP AFAEAETIDD TIEALLKLDY PNYEVILVND CSPDNTAEVV RQYLDDPRIR 
LLNKQVNEGK AMALNDALPM CRGEILVVID ADIIVSRDLL NYMVPHFAGT RVAAVTGNPR 
VRNRVSILQH LQAVEFSSIV SMQRRAQRVL GRVLTVSGAV FAVRRSALLE LGGFTPHMAT 
EDIDLTWRLQ MKFWDVRYEP RAVVWMQVPL SLRELWKQRK RWARGLVQVL KRHREVPTNW 
KMRRMWPIFY ESIFSILWSY VFVLMTSYWL ISLAVGYAPR GVSPFPNFWG MMIATTCLLQ 
LFIGAWVDRQ YDPGIMWSFP EAVFYPVIYW MLMALITSFY TIPALFKKPP RVQTWRIRRG 
PA