Gene Emin_0225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0225
Symbol
ID	6262999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	241259
End bp	242995
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	34%
IMG OID	642610688
Product	ATP-dependent OLD family endonuclease
Protein accession	YP_001875124
Protein GI	187250642
COG category	[L] Replication, recombination and repair
COG ID	[COG3593] Predicted ATP-dependent endonuclease of the OLD family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.000140656
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAATTA AAAATGTCCA TATTCATAAC TTTAGGTCCA TACTAGATGC CGATTTCCCC 
TTGGAATCAT ATTCCATACT TGCGGGAGAA AATAATTCAG GAAAGACAAC TTTTATTAAT 
GCTTTACGAG TTTTTTATGA AGATATAAAA TTTAACAAGG CAGAAGACTT TCCTAAAATG 
GAAACATCTG ATGTAGAGTC TTGGATAGAG GTTGAGTTCA TAACTGTACA AGAAGAGCAA 
GACTTATTAA AAGAAGAATA TAGAAGTGCA GACAAGATAC TAAGGGTTAG AAAGTATCTA 
GCATCCTCCT CTATAGAAAT AAAGTCAACT CAAAGTAATA TCTATGGGTA CGAAAATGGT 
GTTTTGTCTA CCACGCTCTT CTATGGTGCT AAAAATATAT CCCAAGCAAA GTTGGGTAAT 
ATTTTGTATA TCCCAGAGTT AAGTCGCACC GAAGAAGTTA TGAATTTATC AAAAGCAGCG 
TCTCCATTAA AAAGCATTGT AGAATATGTT CTTGGTAAGA TATTAAAAGC AAGTTCTTCT 
TTTTCTGAGC TAAATAAGGC CTTTGAGGTG TTTAACAAAG AATTCCAAGC AGAAAGTTCC 
CCAGAGGGAT TATCTATTAA CAAAATGAAA GAGGATATAA ACTCTGAGCT TAAAGACTGG 
GGTGTTAGTT TGGGTATAAA TATCAATGCG GTCTCTCCAG AAGTTATAAC AAAAAATCTC 
CTCTCTCATT ATTTGCAGGA TTCTAAGCTG GGTGAACAGG AGATAAACAC AAGCAGTGTC 
GGGCAAGGGC TTCAGAGACA CATTATTTAT TCTTTAATAA AAATAGCATC TAAATACCAA 
GACCCTAAAG AAATTAAAAA GAAAGATTTT TCTCCAGATT TTACGCTCAT TTTATTTGAA 
GAGCCTGAAG CCTTTTTACA TCCGTCGCAA CAACAGATTT TAAACATAGA TTTAGAGAGT 
ATTGCTAAGG GAGATAATGA GCAAGTAATA GCAACTACAC ATTCCCCAAT ATTTGTTTCT 
AAAAATATAA ACAATTTGCC CTCACTAATA AGATTGAGTA GGGAAGAGCG AAATAAATGG 
GAAACCAAAA GTTTTAATAT TTCTAAAGAA AAACTGGAAT TATTGCTGTC AGATAATGCG 
GGGCTTGAAG CCTGCTTCAA AAGCACTGTC GCCTTACCTG CTTGTCAAGA AGAACTGAAG 
AAAGCTTTGG CAAAATCTCT GGCCTCGGGT ACATTGGAAG GTTTTTCTGG AAGTGATAAG 
GAAATTATGA ATATTTGCAT GTGGCTTGAC ACAGAACGAG CAAATGCTTT TTTTTCAAAA 
CATGTAATAA TATGTGAGGG GGCAACAGAA AAAGTTCTAT TAGAGTATTT ATTTGCAACG 
CATTGGAAAG ATTTTGCTAA AAAACACATA TATTGTCTGG ATTCTTTAGG TAAGTTTAAC 
ATACATAGAT TTATAAACTT ATTTGATTCC CTAGGAATAT ATCATTCTGT TGTTTATGAT 
TCAGATAACA ATCGTGGTGT TCATGAAATA GTTAATAAAT TTATTCAGAG TAAAAAAAGT 
GCGTACACAC AAAACCTGTT AGCCTTATCT GGCGATGTTG AGTCTGAATT TGGGATTACT 
AAGCCAGCTA ATACGCATTT GAAACCTGCT AACTTATTGT TGCATTTAAT TAAAAATAAA 
ATTACCCAGA AACAAATAGA CTCCTTTAAG GAGAAGTTTA ATTATCTTTC TATATAG

Protein sequence

MKIKNVHIHN FRSILDADFP LESYSILAGE NNSGKTTFIN ALRVFYEDIK FNKAEDFPKM 
ETSDVESWIE VEFITVQEEQ DLLKEEYRSA DKILRVRKYL ASSSIEIKST QSNIYGYENG 
VLSTTLFYGA KNISQAKLGN ILYIPELSRT EEVMNLSKAA SPLKSIVEYV LGKILKASSS 
FSELNKAFEV FNKEFQAESS PEGLSINKMK EDINSELKDW GVSLGININA VSPEVITKNL 
LSHYLQDSKL GEQEINTSSV GQGLQRHIIY SLIKIASKYQ DPKEIKKKDF SPDFTLILFE 
EPEAFLHPSQ QQILNIDLES IAKGDNEQVI ATTHSPIFVS KNINNLPSLI RLSREERNKW 
ETKSFNISKE KLELLLSDNA GLEACFKSTV ALPACQEELK KALAKSLASG TLEGFSGSDK 
EIMNICMWLD TERANAFFSK HVIICEGATE KVLLEYLFAT HWKDFAKKHI YCLDSLGKFN 
IHRFINLFDS LGIYHSVVYD SDNNRGVHEI VNKFIQSKKS AYTQNLLALS GDVESEFGIT 
KPANTHLKPA NLLLHLIKNK ITQKQIDSFK EKFNYLSI