Gene Acid345_0889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0889
Symbol
ID	4069139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1108325
End bp	1109611
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	54%
IMG OID	637982896
Product	lipopolysaccharide biosynthesis
Protein accession	YP_589966
Protein GI	94967918
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3524] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.6181
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATCCG ACGACAGGCT TGCTGCTTCA GTCGATGTGA CGAATGCGGT CCGCGTTAGT 
TCGCGCTTGG ATCGACTCGC CATCGGATGG GAGCGACGAG GCGCGATTGT CAAAGCCGCG 
GTGATAGGTG TGATCGTCAG CACGACTCTC GCTTTCGTTA TTCCAAAGCA GTACGAGTCA 
ACAGCACGCA TCATGCCACC CGAAGGGGGA ATGAGTTCGG CGATTATGGC GGCGCTGGCA 
AGTCGGGCTC TTCCGGGAAA TCTTGGAGCA ATTGCGGGCA GCCTTTTCGG CTTCCAAAGT 
ACCAGCACGG TCTTCGTTAA CTTGCTACAG AGTCGGAGCG TGACCGAACG GGTCGTTGAT 
CGCTTTGATC TTCAGAAAGT CTATCGAAGC CGCTATAAAC AGGACGCCCT AAAAAAGCTC 
CATCGGAGAA CCGAGATTGC AGAAGACCGT AAGACGGGCA TCATTACGAT TACGGTCGCA 
GACACTGACC GTCGTCGCGC TCGCGATATG GCCCAAACTT ATCTCGATGA ACTGAACTCT 
CTGGTAACCC GTGTGAACAG TTCGGCCGCC GGACGAGAAC GCGAGTTCAT CGCACAACGC 
CTTGTCACAG TGAAGCGTGA TCTCGATGAT GCCGAACGCC AGTTGAGTGT GTTTTCGACG 
AAGAACGCCA CGCTCGACGT TAAAGAACAG ACTCGCGCAA TGGTCGAGGC AACAGCAAAA 
CTAGAGGGAG AACTCATTAT TGCGCGTTCG GAATTGAGTT CGCTAGATCA GATATATGGG 
CCCGAGAATG TGAGAGTGCG GGCGGGTCGC GCTAGAGTCG GCCAATTGGA ACATGAACTC 
AAGAATGCCA CCGGCTCTGG TGTGCCGAGC GACATTACCG AATCTACTCC ATATCCTCCT 
TTAAGAGCTC TGCCAACGTT AGGCGTGCAA TGGGCCGATC TCTACCGACG CGTGAAGCTG 
CAGGAAACGG TATTCGAGCT ATTGACGCAA GAGTACGAAC TCGCCCGCAT CGAAGAGGCG 
AAAGCAATTC CAAGCATCAG CGTAATTGAT CCGCCGAATT GGCCGGAACG CAAGTCCTTC 
CCGCCGCGAT TGGTGATCAT GCTCGTAGGG ACCTTACTGA GTGTATTGGG AACCTTCTTC 
GTCATCGTGA GGAAGGCTGA GTGGCGCGCG GTTCCAGAAG AAGATCCGAA AAAGTTACTG 
TTCCGTGCCG TCATGCTCGA CTTGAAAGAG GATAGCCCTC AATGGCTATC GAAGAAGACG 
GTTCACCACA ATGGCCACGA GCTCTGA

Protein sequence

MPSDDRLAAS VDVTNAVRVS SRLDRLAIGW ERRGAIVKAA VIGVIVSTTL AFVIPKQYES 
TARIMPPEGG MSSAIMAALA SRALPGNLGA IAGSLFGFQS TSTVFVNLLQ SRSVTERVVD 
RFDLQKVYRS RYKQDALKKL HRRTEIAEDR KTGIITITVA DTDRRRARDM AQTYLDELNS 
LVTRVNSSAA GREREFIAQR LVTVKRDLDD AERQLSVFST KNATLDVKEQ TRAMVEATAK 
LEGELIIARS ELSSLDQIYG PENVRVRAGR ARVGQLEHEL KNATGSGVPS DITESTPYPP 
LRALPTLGVQ WADLYRRVKL QETVFELLTQ EYELARIEEA KAIPSISVID PPNWPERKSF 
PPRLVIMLVG TLLSVLGTFF VIVRKAEWRA VPEEDPKKLL FRAVMLDLKE DSPQWLSKKT 
VHHNGHEL