Gene Acid345_4106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4106
Symbol
ID	4072297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4863201
End bp	4864112
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	58%
IMG OID	637986137
Product	signal peptide peptidase A
Protein accession	YP_593180
Protein GI	94971132
COG category	[O] Posttranslational modification, protein turnover, chaperones [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0616] Periplasmic serine proteases (ClpP class)
TIGRFAM ID	[TIGR00706] signal peptide peptidase SppA, 36K type

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.827209
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.751736
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGCA ATCGTGGTTC ACGCGTGTTT TTGTGGGTTG CACTTGCCGG TGGCGCATTT 
TTTCTCTTCG TTGCAGCCAT TTTCGTGCTG GTGTACGTTA GCGTCCGCGC CGATGACCAC 
GCACAATTTA CCGGGTTCGG CGACCGCATT GCGGTAGTGG ACCTGGAAGG CGTGATCGTT 
GATCCCAAGA GCGTTGTCGC GCAATTGAAG AAGTATGGCG ACGATAGCTC GATCAAAGCC 
ATCATCCTGC ACATCAATTC GCCCGGCGGT GGCGCTGCGG CTTCGGAGGA GATTTACCGC 
GAAGTGCGGC GCGTGCGCGA TGAGAAGCAC AAGCGCATTG TCGCTTCCAT CGAGACCGTG 
GGCGCGAGTG GCGCGTACTA CGTGGCTTCC GCGACGAACA AGATCTACGC GAATGAAGCG 
AGCATCGTGG GCAGCATCGG CGTGATTGCG GAGTGGTACA ACTACGCCGA CCTGTTGAAA 
TGGGCCAAGC TCAAGGAAAT CACGATGAAA GCTGGTGAAT TCAAAGACAC CGGCTCGCCG 
ACGCGCGACA TGACCCCGGC CGAGAAGGCC TACATGCAGG CGTTGATTGA CGACATGCAT 
TCGCAGTTCA TTCATAACGT GGCGACTGGA CGCAAAGTGA AGGACGAGGA CATTCGTCCC 
ATTGCGGACG GACGGGTGTG GACCGGACGC CAGGCGCTGC CGATGAAATT GATCGACCAG 
ATCGCGGATT TCCAGGCGAC CGTGGCGGAT ACGGCAAAAA GCGTCGGAAT CAGCGGCGAA 
CCGACCTTGG TGACCCCGGA ACGGGAACGT AAGTCGTTGC TGGATCTGAT GTTCGGCGAT 
GTGTCGGACC TGATTCCGGA CCGTGCCAAG CTGATGCAGA CGAACGTCGG CTTTTACTAC 
CTCTGGAAGT AG

Protein sequence

MASNRGSRVF LWVALAGGAF FLFVAAIFVL VYVSVRADDH AQFTGFGDRI AVVDLEGVIV 
DPKSVVAQLK KYGDDSSIKA IILHINSPGG GAAASEEIYR EVRRVRDEKH KRIVASIETV 
GASGAYYVAS ATNKIYANEA SIVGSIGVIA EWYNYADLLK WAKLKEITMK AGEFKDTGSP 
TRDMTPAEKA YMQALIDDMH SQFIHNVATG RKVKDEDIRP IADGRVWTGR QALPMKLIDQ 
IADFQATVAD TAKSVGISGE PTLVTPERER KSLLDLMFGD VSDLIPDRAK LMQTNVGFYY 
LWK