Gene Acid345_1449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1449
Symbol
ID	4071638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1750443
End bp	1751696
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	58%
IMG OID	637983458
Product	phosphodiesterase I
Protein accession	YP_590525
Protein GI	94968477
COG category	[R] General function prediction only
COG ID	[COG1524] Uncharacterized proteins of the AP superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.982314
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGGC TTCTAGCTCG GCTGTGCTTC CTGCTGCTGA TCTCTGTTGG CGCTTTTGCG 
CAAAGCATTC CCGTCATCAC TGTCGATCAA CCGCCGAACT CAGCGGAACA GCAGAAGAAG 
CACTATGTAG TTCTGGTGTC GCTGGATGGC TTTCGATATG ACTACGCGAA AAAGTATGGG 
GCGACGCATC TCCTGGAAAT CGCCAAACAT GGGGCGAGCG TTCCCGACGG AATGATTCCG 
TCGTATCCGT CTCTGACCTT TCCGAACCAC TACACCTTGG TGACCGGACT GTATCCCGAG 
CACCACGGGA TTGTGGGCAA CGAGTTTTAC GATCCGGAGC GCAAAGCGAA GTACGCGTTG 
AGTGACAAAG CGGCGGAAGC CGATGGTACG TGGTACGAGG GCACGCCGTT GTGGTCGCTG 
GCGGTGAAGC AGGGAATGCG TAGTGCCTGT TTCTTCTGGC CGGGATCGGT GGCGGAGATC 
GCAGGAGCGC GGCCCACTTA CTACCTGCGT TACGACAACT CCATCCCGGA CGAGAGGCGT 
GTCGAGCAGG TCATCGCGTG GCTCAAGCTT CCTGCCGAGC AGCGTCCTCA CTTCATCACG 
CTGTACTACT CGAAGGTCGA TCATGCCGGA CACGAATTCG GCCCGGACAG TCCGCAGGTT 
GCGGAGGCAG TGAAGAGTGT GGATGCAACG ATTGGCCTGC TCGAGGAAAA CCTGCAGGCA 
CTGCATCTGC CGATTGACCT GATCGTTGTT TCGGACCACG GCATGGCGAA GACGGACCCG 
AATTGGGTCA CGCTCGACAA ATATGCTTCC CTCGACGGCT TCGTGACGGT TGGGCTGAGC 
CTGTACGCAC CCTCGGAAGC TGCCGCCGAA AAGGCGTACG AGAAGCTGAA GGGCGGGGAT 
TCGCGCTTCA ACGTCTACCG GCGGAAGGAC GTGCCGGCTG AGCTGCATTT CAACAGCAAT 
CCGCGCGAAG GAGATCCGGT GGTGGTTGCA AAGGGTTCGT GGGCGATCCG CGCGACCACA 
AACTCCTACG GCGGAGACAA GCCACCGAAT ATTGGCAATC ATGGGTTCGA TCCGCGTGTG 
CTGCCGGAGA TGAAGGCGGT CTTTTACGCG GAGGGGCCCG ACATCAAACC CGGAGTTCAG 
TTGCAGAGCT TCGAGAACGT AAACGTGTTC CCGTTGATTG TGGAACTGCT AGGTCTTGAT 
AGCCCGAAGG TTGACGGTGA CCCCAAAGTT CTTTCGGGAA TTGTTAAGAA ATAG

Protein sequence

MKRLLARLCF LLLISVGAFA QSIPVITVDQ PPNSAEQQKK HYVVLVSLDG FRYDYAKKYG 
ATHLLEIAKH GASVPDGMIP SYPSLTFPNH YTLVTGLYPE HHGIVGNEFY DPERKAKYAL 
SDKAAEADGT WYEGTPLWSL AVKQGMRSAC FFWPGSVAEI AGARPTYYLR YDNSIPDERR 
VEQVIAWLKL PAEQRPHFIT LYYSKVDHAG HEFGPDSPQV AEAVKSVDAT IGLLEENLQA 
LHLPIDLIVV SDHGMAKTDP NWVTLDKYAS LDGFVTVGLS LYAPSEAAAE KAYEKLKGGD 
SRFNVYRRKD VPAELHFNSN PREGDPVVVA KGSWAIRATT NSYGGDKPPN IGNHGFDPRV 
LPEMKAVFYA EGPDIKPGVQ LQSFENVNVF PLIVELLGLD SPKVDGDPKV LSGIVKK