Gene Acid345_2849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2849
Symbol
ID	4070368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3387584
End bp	3388582
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	56%
IMG OID	637984867
Product	glycosyl transferase family protein
Protein accession	YP_591924
Protein GI	94969876
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.659984
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCCA TCTCCGTCAT GACGCCTTGC TACAACGAAG AAGGCAACGT GCAGGAAGTG 
TACCAGCGAG TGCGGGCCGC GATTGCGGGC CTCGGGCCGG GATACATTTA CGAGCACGTG 
TTCATTGACA ATGCGTCGCG CGACAACACA TGGGCGGAGC TTCGCAAACT GGCGGCAGCC 
GACAAGAACG TCAAAATTAT TCGCAATACG AGGAATTTCG GTCACATTCG CTCGCCCATG 
CACGCATTCC ATCAGTGCAG CGGCGATTGC GTGATCGGGC TCGTTGCCGA TCTGCAGGAC 
CCGCCGGAGA TGATTCCGCA AATGGTGGCC AAGTGGGAGG AGGGCTTCCC CGTCGTTGTG 
TGCGTGAAAA CCGGCAGCGA CGAGCACGGC CTCATGTATT GGATCCGGAC GAAGTACTAT 
CGGCTCGTGA ACCGCCTCTC TGGCGTGGAG ACTTACGAGA ACTTCACGGG CTTTGGGCTC 
TACGACCGCA GAGTCGTGGA TGCAATTAAG AGTATGCGCG ATCCCTATCC GTATTTCCGC 
GGGCTCGTGG CGGAAATCGG ATACCCGCAC TACTCGATCG AGTTTCACCA GCCGCTGCGG 
CGGCGGGGCA TCACCAAGAA CAACTTCTAC AGCCTCTACG ACAATGCCAT GCTCGGCATC 
ACGAACCTGT CGAAGGTGCC GCTGCGACTG GTGAGTTTTG CAGGCTTCTT AGGGGCGTTG 
CTTAGCGTGT GCCTTGGCTT TGCATATCTC ATCTACAAGC TGGTTTTCTG GAAGAACTTC 
TCCGTCGGAA TTGCGCCGCT GGTGATCGGT ATGTTCTTTC TGGCATCAAT CCAGCTGGTA 
TCGCTGGGAA TCATCGGCGA GTACATTGGG CAAATCCATA CCCAGATTCA AGATCGCCCG 
TTTGTTTTTG AGCAGGAACG CGTGAACTTC GAGTATCCGC CCGGAGAACC GCTCATATCG 
GCGCTAACGG AGATTGCGAA CGAGGAACGG AAGGCGTGA

Protein sequence

MKSISVMTPC YNEEGNVQEV YQRVRAAIAG LGPGYIYEHV FIDNASRDNT WAELRKLAAA 
DKNVKIIRNT RNFGHIRSPM HAFHQCSGDC VIGLVADLQD PPEMIPQMVA KWEEGFPVVV 
CVKTGSDEHG LMYWIRTKYY RLVNRLSGVE TYENFTGFGL YDRRVVDAIK SMRDPYPYFR 
GLVAEIGYPH YSIEFHQPLR RRGITKNNFY SLYDNAMLGI TNLSKVPLRL VSFAGFLGAL 
LSVCLGFAYL IYKLVFWKNF SVGIAPLVIG MFFLASIQLV SLGIIGEYIG QIHTQIQDRP 
FVFEQERVNF EYPPGEPLIS ALTEIANEER KA