Gene Acid345_0086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0086
Symbol
ID	4069710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	87032
End bp	88573
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	61%
IMG OID	637982086
Product	hypothetical protein
Protein accession	YP_589165
Protein GI	94967117
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAGC TTCGGCTTGC GTGTGCTTTG CTGGCGCTGA TCGCATCGGC ATTTGCTGCG 
GGACCGCCGG TCGTTGAGCC GGTAATCCAC GGCGACCAGG CGGTCACGGC TGAGCACAAC 
GGCACGCAGT ATCCGGTGTT TCGCTTTGCG CAGGACCAGA AGCTTGTTGC TTCCATCCAG 
CACGTTTTCG CGAGTTCGTT TGCGGGAGAG ATGCAGAAGC TCTTCATCAT GAGCCGTGAT 
ATTGCGAGCG CGCGCGATCG GCGCGACGGC CTTAGGGGCG ATCCCGAATT CGCGCAGCCG 
ATTTACCTGT TGCTGTCCCA GGAAGAAGGC GGATACGCGC GGCGCGATTT CTTTTTGGAG 
AGTGAAGATG GCGAGCGCGT GTTCCTGGCC GCTGACTACA TCGACTTAGT CGTCGATCAG 
GAGTCGGTGG ACAGCGGCGA CTTCGAAGAG ATCTTCTCGC ACGAGCTTGG TCACTCGATT 
CTGCGGAACC TCGTCGGGGA ACTCGTCGGC GCGCGCTCGA ACAAGATGCA CCAGAGCGTG 
ACGCTAACCG ACTATCGCAC CGCGTTCGAC GAAGGCTTTG CGGAACACTT CCAGCCGGTG 
GTTCGGCAGA ACTCAGCGAA TCCTTCGCTT ACGCGGCAGC AACGAGGCGT AGTCGCGCCG 
TCCTTGGCGC AGGATTTCCT GAGCCAGCGC GACCAGGTGC TGCGCAACTT CGGCCCGCCG 
AGTTATGTCT TCCTTCACGA ACGGATGGTG CCGGCGTGCG CATCGCTCCG CGAGTGCTAC 
GTGGTCGAGG AGACTTCGAC CAGCTTCGAT CCGAGCCAAC TCCGCAGCGG CCAGCAAATG 
CTGTCTTCCG AAGGCGTGGT CTCGACCGTC TTCCTGCAAC TTCTCTCGGA AGGCGGTGCG 
CCAGTGTGTG GTGCAGATTG CGCGCAACTC GAAGCGAAAT ACCGCAAGCT CTTCGAAGCT 
CTCGCCGAGG TGAAACCGAA CGCGACGCAG TCGCCGTTGA TCCAGATGCT CGAGAGTTAT 
CGCGGGAAGT ATCCGGAGGA GGGCAAACGC GTAGTGGCGG ACTTTGTGCT GCTCACGCGG 
GGAGCGACGG TTTCGACGGA ACTCGCCCAC GGCACAGAGG CAATGAGTGC GGCTTCATCA 
CGCGCCGACA TTGCGGCCTT TCGCACGCAA CTTCATGCGG CACAAAAGCT GCTCGCCCAA 
GCCACGGACG ACGTCCTTGC CGGAAAGCTC AAGCTCGATG CCGCCGTCGG GCCTGAACTG 
TGGATTCGCA ACGAGGCGTT CACGCAGGCA AGTCTGTTTC CCGGGAGCGA GGAGGCGCCG 
CTGCGGACCA ATCTGAATAC AGCTTCGGCG GAGGAGATCG CGACACTGCC GCAGTTCTCA 
AAGGAAACGG CGCAGGCGAT GGTTCGCGAG CGCCGTCAGA GAGGATATTT CAGGTCAATC 
GATGAAGTGA TTTCGTCGGC AAAGCTCAAC CCTGGACAAG CAGAGGTCAT TAAGAAGGCA 
GAACAGTCGC AAGCTGGCGC GAAGGCGGAC CCTGTGCGCT AG

Protein sequence

MKQLRLACAL LALIASAFAA GPPVVEPVIH GDQAVTAEHN GTQYPVFRFA QDQKLVASIQ 
HVFASSFAGE MQKLFIMSRD IASARDRRDG LRGDPEFAQP IYLLLSQEEG GYARRDFFLE 
SEDGERVFLA ADYIDLVVDQ ESVDSGDFEE IFSHELGHSI LRNLVGELVG ARSNKMHQSV 
TLTDYRTAFD EGFAEHFQPV VRQNSANPSL TRQQRGVVAP SLAQDFLSQR DQVLRNFGPP 
SYVFLHERMV PACASLRECY VVEETSTSFD PSQLRSGQQM LSSEGVVSTV FLQLLSEGGA 
PVCGADCAQL EAKYRKLFEA LAEVKPNATQ SPLIQMLESY RGKYPEEGKR VVADFVLLTR 
GATVSTELAH GTEAMSAASS RADIAAFRTQ LHAAQKLLAQ ATDDVLAGKL KLDAAVGPEL 
WIRNEAFTQA SLFPGSEEAP LRTNLNTASA EEIATLPQFS KETAQAMVRE RRQRGYFRSI 
DEVISSAKLN PGQAEVIKKA EQSQAGAKAD PVR