Gene Acid345_3447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3447
Symbol
ID	4070331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4066231
End bp	4067955
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	58%
IMG OID	637985469
Product	Zn-dependent hydrolase
Protein accession	YP_592522
Protein GI	94970474
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.453465
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTCGC ACAAGAAGCG GTCGCTAACC TGGATCCTCA TCGCTCTCTT ATCGGTCTCG 
AGTGCTGTCT GTCAGACCAC GAAGAAACCC GTCCACAAGA AATATCCGAT CGGCGGATCG 
GCGCCGAACG GCGCACGGCT CAAAGCCGCT GATCTCGATG CGCGCCTGGC GAAATGGCGG 
CGCACGCCAA TGCCGTTCGA CAGTGAAAAG CTGGCGGCGC GCGATGTGTG GATGATCCAG 
AAGCTGGTGA CTGCATGCCA GTATCTGGAT GCGATCTATT GGCGGCAGTC CGATCCCGAT 
GGGCTGACGC TCTACAAGCA GCTTGAGTCG AGCAAGATTG CACGCGATCA GAAGATCGTG 
CGCATGCTGC AAATCAACGG CAGCCGCTGG GACCTCCTCG ACAACAGCCA GCCGTTCGTA 
GGCGATGAGA AGATGCCGGC TGGCCATGCG CTCTATCCGG CGGGCATCAC ACGCGACGAA 
ATTGAGAAGT ACGTCAAAGA TCATCCGGAA GAGAAAGACG CGATCTACAA CGAGCGCACG 
GTACTTCGAC GCAATGGCAG TGAGTTGCAG GCGATTCCGT ATCACGTGGC GTATCGCGCG 
TTTCTGGAGC CGGCAGCGCG GGCGTTGAAG GAAGCCTCGG CGCTGGCGCG CGACAAGGCC 
TTCGCAAACT TCCTTCGCAT GCGCGCCGAT GCGCTGCTGA ACGACGATTA CTATCCGAGC 
GATGTGGCGT GGCTGGAGCT GCAGAACCCA CGTTTCGACA TCATCATGGC GCCGTACGAG 
ACCTATCTTG ACGACCTGCT TGGCGTGAGG ACGAGTTACG GCGCAGCGGT GTTGATCCGC 
AATGATCACG AGAGCCGGCG GCTTGATCTC TATGAAAAGT ACGTTCCGGA GATGCAGCAG 
GCACTGCCGC TGACTGCGGA GGACAAGCCT TCCAAAGAAG GCCAGCGCAT GCCGATGGAA 
GTGATGGATG CGCCGTTCCG CACCGGCGAT CTTGGCCATG GCTACCAGGC CGTCGCCGAC 
AATCTGCCGA ATGATCCGAA GATCCACGCC GAGAAGGGCA CCAAGAAGAT CTTCTTTAAA 
AACTTTATGG ATGCCCGCGT CAACTACGTC GTGATTCCGA TGGCGCAGCT TGTGATGGAC 
TCGGTGCAAG CGACGAAGGT CACGGCAGAA GGCTACCTGG CGACGACCCT GATGCACGAG 
ATTGCGCACG GTTTGGGGCC GGCCTTCGCG CGCGGGCCCA ACAAACTGGT GGATATCCGG 
GAGGCGATTG GCGCCAGCTA CAGCGGCCTG GAAGAAGCCA AGGCCGACAC TGCCGGCATG 
ATTTGCCTGC AATGGATGAT CGACCACGGA TATATCCCCA GGACGAAGTC CGACGAGTAC 
TACATTACGT ATGTCGCCGA CCTCTTCCGG GCGATGCGTT TTGGCGCTGG AGAAGCCCAT 
TCCGCCGCCG AGACGATGGA ATTCAACTAC CTCGCTGAGC AGGGCGCCAT CAAGCGCGAC 
GCAAATGGCC GATATTCGGT GGACACGGGC AAAATTCCGG CCGCCGTAGC TGCATTAGCC 
AAAGAGTTAC TAGAGATCGA GGCCACTGGG GACCGCGATC GCTGTGAAAA ATGGTTCTCC 
CATTACGGAA GTTTTCCGCC GGAGTTGACC AAATCTCTGG ACGCGGCGAA GAATGTTCCA 
GTAGATATAG ACCCGGTCTT TTCCTTCCCC AGGAAGCTCC AGTAG

Protein sequence

MDSHKKRSLT WILIALLSVS SAVCQTTKKP VHKKYPIGGS APNGARLKAA DLDARLAKWR 
RTPMPFDSEK LAARDVWMIQ KLVTACQYLD AIYWRQSDPD GLTLYKQLES SKIARDQKIV 
RMLQINGSRW DLLDNSQPFV GDEKMPAGHA LYPAGITRDE IEKYVKDHPE EKDAIYNERT 
VLRRNGSELQ AIPYHVAYRA FLEPAARALK EASALARDKA FANFLRMRAD ALLNDDYYPS 
DVAWLELQNP RFDIIMAPYE TYLDDLLGVR TSYGAAVLIR NDHESRRLDL YEKYVPEMQQ 
ALPLTAEDKP SKEGQRMPME VMDAPFRTGD LGHGYQAVAD NLPNDPKIHA EKGTKKIFFK 
NFMDARVNYV VIPMAQLVMD SVQATKVTAE GYLATTLMHE IAHGLGPAFA RGPNKLVDIR 
EAIGASYSGL EEAKADTAGM ICLQWMIDHG YIPRTKSDEY YITYVADLFR AMRFGAGEAH 
SAAETMEFNY LAEQGAIKRD ANGRYSVDTG KIPAAVAALA KELLEIEATG DRDRCEKWFS 
HYGSFPPELT KSLDAAKNVP VDIDPVFSFP RKLQ