Gene Acid345_3823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3823
Symbol
ID	4071107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4519284
End bp	4520369
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	54%
IMG OID	637985846
Product	glycosyl transferase, group 1
Protein accession	YP_592897
Protein GI	94970849
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.372091
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.833222
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTTTCCG ACATCGAGCA TGAGCCGATT GGAAACGTGC GGTTTGTCAC GGGGCCCAAG 
TATGAACGCA AGACCGCAGC ACGACGATTC AAGACGTGGT TCAAGTATTG CTGGCAGGCG 
ACAAGGCTCG CTTTCCGCAC CAAGGGTGAT CCGAAGCTGT TCATCGTGGC GCAACCGCCG 
TTTCTCTCGT TGCTAGGCTA TTTGCAAAAG AAGTTGATGG GCCGCAGATA CTTTCTTTGG 
ATTGACGATG TGTGGCCTGA CATCATTGTT GGACAAAAAA TGCGGGAAGG CTCTTCGTGG 
GGCATTCGGC TCTGGGCTGG CTTTAACCGC GTGACTTTCA GGCATGCAGA GCACGTATTT 
ACTCTTGGGC CATACATGAG AGACAAGGTC AGACAGTATG TGCCGGAGAA CATCCCGATA 
ACTATCATTC CGACGTGGGT TGATATCGAT TCGATCCGGC CAATTCCGAA GGAGCAAAAT 
CCGTTTGCCG CTGAACACGG ACTGGGCGAC AAATTGACAG TCCTCTATTC TGGGAACCTG 
GGCTTGACCC ACGATATTCA GAGCATCCTT GAAGCAGCGC GCATTCTTCG TAATGAGGTG 
TCTTTGCATT TCATGATCAT CGGCGCCGGG CCACAGTGGG ATTCAATCGA GCGATCGATC 
AAGGAACATC AGGATGCGAA CGTGACGCTT CTGCCTCTGC AGCCGATTGA TGTTTTGCCG 
TTCTCTCTGG CGACTGCTGA CATCGCGATT GCTTCGCTGG AACAGGGAAT TGAGGGAGTA 
AGCATGCCGA GCAAGACCTA CTACAGCATG GCCGCAGGGT CGGCTATTGT CGGCATCTGC 
GAGACGAACA GCGACTTGGC ACACGTGGTT CTTTCGAACC AATGCGGCGG AGTGGTTCGT 
CCCAAGAGTC CGGAAGCTCT GGCTGAACTC ATTCTGCGAA TGGCCACAGA TCGGGAGCAG 
CTAGGGCGAT TGCGAGAGAA CGCTCGCCAC GCGGCTGTGA ACTGTTATTC GCGGAGTGCA 
AATACTCCGA AGTTGCGCGC GATTCTGGAA GGAAAAGTGG AACCGGTAGC ACAGGGCCAA 
TCATGA

Protein sequence

MFSDIEHEPI GNVRFVTGPK YERKTAARRF KTWFKYCWQA TRLAFRTKGD PKLFIVAQPP 
FLSLLGYLQK KLMGRRYFLW IDDVWPDIIV GQKMREGSSW GIRLWAGFNR VTFRHAEHVF 
TLGPYMRDKV RQYVPENIPI TIIPTWVDID SIRPIPKEQN PFAAEHGLGD KLTVLYSGNL 
GLTHDIQSIL EAARILRNEV SLHFMIIGAG PQWDSIERSI KEHQDANVTL LPLQPIDVLP 
FSLATADIAI ASLEQGIEGV SMPSKTYYSM AAGSAIVGIC ETNSDLAHVV LSNQCGGVVR 
PKSPEALAEL ILRMATDREQ LGRLRENARH AAVNCYSRSA NTPKLRAILE GKVEPVAQGQ 
S