Gene Acid345_3848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3848
Symbol
ID	4071000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4557038
End bp	4558147
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	58%
IMG OID	637985872
Product	phosphoesterase
Protein accession	YP_592922
Protein GI	94970874
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3511] Phospholipase C
TIGRFAM ID	[TIGR03397] acid phosphatase, Burkholderia-type

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.352013
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGTGA GTTCAACACC CGGACCGGGA ACCGGCGGGA CCGCGGTTTC TCCGGTGAAG 
CGGGTGATTG TGCTGATCCT GCAGAACCAT TCGTTCGATT CGTTGTTTGC GACGTATCCG 
GGCGTGATGG ACCCGTTGTC ATCAGGTTCG CCGGGATACA CGCAGGCGAG CGCGAGCGGT 
GGCGGTACGG TCACGCCGTA CTTGCTAACT GATCCATTTC CCGCGGACAT GCCGCACGGC 
GCGAAGTACT ACAATGCGAG CATCAACGGC GGAAAGATGG ATGGGTTCGC GGTCGCTGAG 
CAGACCAACG TGTCGATGGG GCATTACGAC AGCACGATTC CCGGCGTGGA TACGATCTGG 
AATTACGCCG GACAGTTCGC GCTAGCCGAC AACTTCTTTA TGCCGGATGT TGGAACGGAG 
CCGAACCTCG CACTGATGAT GATCTCGGCG CAAGGTACGG GGAACGAATT CGGGGTACAG 
CCGTCCTACG GACCGTGCAA CAAGACGGAC CCGGATGCGA AGGCGCTGAC GAACAAGAAT 
GTCGGCGACG AAATGACTAC AGCCGGCGTG ACGTGGAGCT GGTTCCACGA GCAGTATGGC 
GTTTGCGGCG ATTACGTGGC GACGGAGAAC CCGTTCCAGT ACTTCACGAG CACGCAAAAC 
AGCGCGAATT TACAGGACAT TTCGCTCTTC TATTCGCAAC TGGACGGTGG GACGCTGCCG 
TCAGTTTCGT TCGTGAATCC GGGCGGCGGA CATAACTGCC ATCCGGGAAA CAGTTCGATT 
ACGACGTGCG CGGAGTATCT CGACAAGCTG GTGCAGCGAA TCCAGAAGTC GCCGGTGTGG 
CCGGACTGCG CGGTGGTGGT GGTGTGGGAC GAGAGCGGCG GGTTCTACGA TCACGTGCCT 
CCGCCAACGG TGGGCGGAAA CTTGGATGGG ATGCGGATAC CTATGATGGT GATCTCGCCG 
TACGCGAAGA CTGGATACAT CTCGCATGTG CAGATGGACT TGGTTTCACT CTTGCGGTTT 
ATCCAGTGGA ACTGGACGCT GCCGAACCTG AATTCGCGGA ACTCCGCGCC GGGTGCAACG 
ATTGAGATGA AGGACATGTT TACGTTCTAG

Protein sequence

MAVSSTPGPG TGGTAVSPVK RVIVLILQNH SFDSLFATYP GVMDPLSSGS PGYTQASASG 
GGTVTPYLLT DPFPADMPHG AKYYNASING GKMDGFAVAE QTNVSMGHYD STIPGVDTIW 
NYAGQFALAD NFFMPDVGTE PNLALMMISA QGTGNEFGVQ PSYGPCNKTD PDAKALTNKN 
VGDEMTTAGV TWSWFHEQYG VCGDYVATEN PFQYFTSTQN SANLQDISLF YSQLDGGTLP 
SVSFVNPGGG HNCHPGNSSI TTCAEYLDKL VQRIQKSPVW PDCAVVVVWD ESGGFYDHVP 
PPTVGGNLDG MRIPMMVISP YAKTGYISHV QMDLVSLLRF IQWNWTLPNL NSRNSAPGAT 
IEMKDMFTF