Gene Acid345_0890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0890
Symbol
ID	4069140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1109595
End bp	1110935
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	57%
IMG OID	637982897
Product	polysaccharide biosynthesis protein
Protein accession	YP_589967
Protein GI	94967919
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.267642
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACGA GCTCTGAATC GCTGACGGTT GGAATTCTCC AGCCGCGCAA ACGAATTGAA 
GGCGCGCCCC TCGCACGGAA CGTCGTGTTC AGCGTAGTCG ACTACCTGAC GCAACCGCTC 
CTGATGTTGC TTACAGCGCG CTACTTCGTC AGAGCGCTGG GGTTACCGCT TTTCGGGATT 
TGGATTTTGG TCCTCGCCAT CATTGGGAGC AGTGGCAGCA TCTGCACGGG TTTTGGAGAC 
GCGGCATTGA AGTATGTCGC CGCTATGCGT GGCCGCATGG ACGATGACGG TGTTTCGCGA 
GTTATCGGCT TATCTGCAAT GCTGAACCTT TCCATGGGAA TTGCGTTAGC GCTCGCGTTT 
TATGCGCTCG CACCCTGGTC CGCCACGCAC ATGTTCCATC TCAGCGGACA ACTAGCTACC 
GAGTTCGTTA CGGCTCTTCG CATTGGCGGG GGCGTCCTCG CCGTTCGGTC GCTATCCTTC 
GTTTTCATTG GGGCATTCCG CGCATTTGAA CTATATGAGC GGGCAACTCA GGTTGTCGTG 
AGTACGAGAC TTGCAACAGC TCTCGCGGCG CTCGTCTTGG TCTGGAAAGG GTTCGGAGTC 
GTCGCAATTC TTTGGATCAC TTTGATTTGC GAATTCGGAG CACTCTTAAC GTTGGTGCAC 
CGCGGCGCCG GGGTTTGGCG AGAGGTTCGT GTCCCGCGGC TTAAAGAAGA TGACTGGCGA 
TCGCTTACAT CGTTTGGCTT CTTCGGATGG GTCCAGGCGC TCTCCGGAAC ACTCTTCAGC 
CAAGCCGACC GGCTCGTCGT CGCCGCTTTG CTCGGACCTT CAGCTTTGAC CTATTACGGC 
GTGTGTGTGC AATGCACGCA GCCGATTCAC GGACTGACCG CAGCTGGATG CAATGTCTTG 
TTCCCGCATC TGAGCACGAA GGTCGAGACC GCCGGCACAT CGTATTTGCG GAAGTTTCTG 
GCTCGCGCAT TTCGTCTCAA CCTACTCACC GTTCTTGGGT TGGCGATCGT GCCCCTCCTG 
TTGAGCAGAC CTCTCCTCAC ACTCTGGATG GGAAAATCAT TCTCCGACCA TGCAGCTGTC 
ACACTTTCCC TCGTGGCGGC GAGCTTTGCT CTCCTTGCTC TGAATGTCCC AGGTCACTAC 
GCTCTCATGG CTCTCGGAGA GGTGCGGTAC CTGACAATCT TGAATGTAGC CGGGTGCGTC 
CTGTCTCTCT TACTCGCTTG GTTCTTTATC CCGAAGATCG GAATCGCGGG AGCAGCGGCT 
GCAAGGCTGG CATACGGCCC GTTGACCTGG TTGTTGTATG CGAGGCTGCA GCGGCTAACA 
AGCCGGGAAG AGGCGAGATA A

Protein sequence

MATSSESLTV GILQPRKRIE GAPLARNVVF SVVDYLTQPL LMLLTARYFV RALGLPLFGI 
WILVLAIIGS SGSICTGFGD AALKYVAAMR GRMDDDGVSR VIGLSAMLNL SMGIALALAF 
YALAPWSATH MFHLSGQLAT EFVTALRIGG GVLAVRSLSF VFIGAFRAFE LYERATQVVV 
STRLATALAA LVLVWKGFGV VAILWITLIC EFGALLTLVH RGAGVWREVR VPRLKEDDWR 
SLTSFGFFGW VQALSGTLFS QADRLVVAAL LGPSALTYYG VCVQCTQPIH GLTAAGCNVL 
FPHLSTKVET AGTSYLRKFL ARAFRLNLLT VLGLAIVPLL LSRPLLTLWM GKSFSDHAAV 
TLSLVAASFA LLALNVPGHY ALMALGEVRY LTILNVAGCV LSLLLAWFFI PKIGIAGAAA 
ARLAYGPLTW LLYARLQRLT SREEAR