Gene Acid345_0837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0837
Symbol
ID	4072363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1039966
End bp	1041348
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	58%
IMG OID	637982846
Product	polysaccharide biosynthesis protein
Protein accession	YP_589916
Protein GI	94967868
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.920136
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAAA AAGAACGTAC TGCATCCACC GACGACCCGC GGGTGAATTG GCATTTAGAG 
GACGATTCAC TTCCATCCGT CGAAATTCCT GTTCAGGTCG GCAAGCCACG TTCTCTCAAG 
GCGAACGTCA TTTGGACCCT ATGCGGTAAT TTCATCTACG CTTTCTCGCA GTGGGCCATG 
CTCGTTTGTA TCGCTAAATT AGGGGATCCG ACGATGGTCG GACAATTCGC ATTCGGATTG 
GCGGTGAGTG CTCCCATTTA CATGTTCACC AACATGCAAC TCCGGTCCGT GCAAGCCACC 
GATGCGAAAA GCGAGTACCG CTTCTCAGAG TATTTCGGGC TCCGCATGCT GGCCAGCGTC 
GCCGGTCTTC TTGCCGTCTG TGTTGTCTCG GCGCGCAGTT CTTCAATGCG TACTACCGCG 
CTCGTGGTGT TCGGCGTCGG CCTTGCTAAG TTCATGGAAA GCGTGAGCGA CGTAATCTAC 
GGGCTCTGCC AGAAACACGA GCGCATGGAC AGCATCGCGA TCAGCATGTC CATAAAAGGG 
CTTGGATCTG TTGCCGCACT TGTGGGCGTC CTTCGCTACA CCCACAACTT GGTTTATGCG 
GTGCTCGCCA TGGCCGGGTG GTGGGCTCTA CTGCTGCTGT TTGTCGACCT TCGTTGGGCA 
CATAAATTCG CACAGATCGA CCCCGCGGAC CAGGGCACGA TTATTCCTTC GTTCGAACGG 
AAAATACTCT TCTCGCTTGG CGTCCTGGCG CTCCCCATGG GCATCCAGAC CATGCTCGCC 
AGCCTGACAA CCAACATTCC GCGATATGTC ATTCAGCACG ACATGGGCGC CGCGGCATTA 
GGTCTCTATG CCGCCATGGC TTACTTCATG CTCGCGGGAC ACACCGTCAT CGCTGCGGTT 
GGCAATTCCG TCCAAGCCAG ACTGGCGCGG CATTGGCAGC AATCCCTGCC ACTCTTTCGG 
CGCTTGCTGG TTCGCTGCGC GGTCTTTGCC TTCGGCATGG GAGCGCTCGC AGGAGTGATT 
GCGCTTGGGG CCGGCAAACC GCTTCTCACC CTCTTCTACC GGCCAGAGTA TGCGAAGAAC 
CACAACGCAT TCACGGTACT CATGTTCGCC ACCGGCTTCT ATTATGTCGG ATCGATGCTC 
GGCGCCGGCG TGGCAGTGGT GCGGCGCTTC TGGCTCTTTA CGGTGCTCTA CGCCAGCGTT 
CCGCTCGTCG CATTAACGTC CTCGATCGTG CTTGTCCCGC GCTCAGGCTT GATGGGAGCG 
GCCATCGCAA CCCTCATCTT TTGCGTGGCA AACGCCGTGG TTCCGATGAT CGTTATCGCG 
CAGGCGTATA GACAACGCGT CGGTGCGCTT CCGGGGGTCG CCCCTTTAAG CGAACCTGCA 
TGA

Protein sequence

MSQKERTAST DDPRVNWHLE DDSLPSVEIP VQVGKPRSLK ANVIWTLCGN FIYAFSQWAM 
LVCIAKLGDP TMVGQFAFGL AVSAPIYMFT NMQLRSVQAT DAKSEYRFSE YFGLRMLASV 
AGLLAVCVVS ARSSSMRTTA LVVFGVGLAK FMESVSDVIY GLCQKHERMD SIAISMSIKG 
LGSVAALVGV LRYTHNLVYA VLAMAGWWAL LLLFVDLRWA HKFAQIDPAD QGTIIPSFER 
KILFSLGVLA LPMGIQTMLA SLTTNIPRYV IQHDMGAAAL GLYAAMAYFM LAGHTVIAAV 
GNSVQARLAR HWQQSLPLFR RLLVRCAVFA FGMGALAGVI ALGAGKPLLT LFYRPEYAKN 
HNAFTVLMFA TGFYYVGSML GAGVAVVRRF WLFTVLYASV PLVALTSSIV LVPRSGLMGA 
AIATLIFCVA NAVVPMIVIA QAYRQRVGAL PGVAPLSEPA