Gene Acid345_4097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4097
Symbol
ID	4072288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4856689
End bp	4857879
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	57%
IMG OID	637986128
Product	phosphoesterase
Protein accession	YP_593171
Protein GI	94971123
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.217924
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTTACGG ACAGACTCAA GCAGTTTTGC CTGGCGGTAG CGGTGTGCGT ATTGAGTTTC 
GCGGCGATTA GTTCAGCGCA AGTTCCTTCC TCCAACCATG TATTCGTTCT TATGGAGGAG 
AACCACAGTT ACAGCCAGGT GGTCGGCAGT CCGAACATGC CGTACCTGAA TTCCCTGATC 
CAGCAATATG GGCTGGCGAC GAATTACGAC GCGAACAGCC ACTACTCGCT GCCCAATTAT 
TTCTGGATCA CCACCGGCAA GTACCTGACA CTGAACGACG GCACCACCGC AGTATTCAAC 
GTGGACAACG TGGTGCGGCA AATGCTCTCG GCGGGCAAGA CCTGGAAGGC GTATGAGGAG 
AGCATTCCTT CCGAGGGGTA CACGGGTGGA ACGGTTGAGC CGTACGAGAA GAACCACAAT 
CCGTTTTCCT ATTTATCGGA CGTGGTGAAC AGCTCGCAGG CGAACAACAT GGTTCCGTTC 
ACTCAGTTCG CAACCGACAT CGCGAATAAC GACCTCCCGA ACTTTGGATG GATCGGTCCG 
AATGGCACGC ATAACGGACA CAACGCTGGT CTACCGACGA TGGACGCGTG GCTGAAGGCG 
AACCTGCCGC AATTGCTAAG CAGTCCGGCA TTCCAGCCCG GCGGCGATGG ACTGTTAATC 
ATTACGTTCG ACGAATCGGT GGACTCCGAC TGCGCGCCAT TGGCGAGCTG TCCGAAGCTT 
CCGGAAAACG GCGGCGGCGG GCACGTTGCA ACGGTATTGA TTGGGCCGAA CGTGAAGAAG 
GGATTCCAGT CGAGCACGTT CTACCAGCAT CCGAGCGTGC TGCGGACGGC GCTGATGGCG 
CTTGGCATCA ACAGCGCTCC GGGCGCCGCG GCTACGGCAC CCCTCATGAC GGACTTCTTC 
TCGGCGACGA CAACTGGCTG CACGGGCACC GGCACGAACC AGACGGTAAC GATCTGCTCC 
CCTGCGAATG GAACGACGAT GGGAACCACA GCCGTAGAAG TGAGCGCGGT GGCGAACGAC 
TCGAAGCCGG TGAGCTTCAC GCAGGTTTAC ATTGATGGCG TGAAGAAGTA CGAGGTGATG 
GGCGGCAAGG TTGATACCAC TCTGACGCTT GCGTCTGGAA CGCGGCGCAT TACGGTGCAG 
GCCTATGACG GAATTTATTT CAAGAGCACG ATCTATGTCA CGGTGCCGTA G

Protein sequence

MFTDRLKQFC LAVAVCVLSF AAISSAQVPS SNHVFVLMEE NHSYSQVVGS PNMPYLNSLI 
QQYGLATNYD ANSHYSLPNY FWITTGKYLT LNDGTTAVFN VDNVVRQMLS AGKTWKAYEE 
SIPSEGYTGG TVEPYEKNHN PFSYLSDVVN SSQANNMVPF TQFATDIANN DLPNFGWIGP 
NGTHNGHNAG LPTMDAWLKA NLPQLLSSPA FQPGGDGLLI ITFDESVDSD CAPLASCPKL 
PENGGGGHVA TVLIGPNVKK GFQSSTFYQH PSVLRTALMA LGINSAPGAA ATAPLMTDFF 
SATTTGCTGT GTNQTVTICS PANGTTMGTT AVEVSAVAND SKPVSFTQVY IDGVKKYEVM 
GGKVDTTLTL ASGTRRITVQ AYDGIYFKST IYVTVP