Gene Emin_0596 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0596
Symbol
ID	6262801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	651241
End bp	654072
Gene Length	2832 bp
Protein Length	943 aa
Translation table	11
GC content	43%
IMG OID	642611067
Product	excinuclease ABC, A subunit
Protein accession	YP_001875488
Protein GI	187251006
COG category	[L] Replication, recombination and repair
COG ID	[COG0178] Excinuclease ATPase subunit
TIGRFAM ID	[TIGR00630] excinuclease ABC, A subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	1.56752e-16
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAATTTA TAAAAATAAA AGGCGCCAAA AGCCATAACT TAAAAAACAT TTCGGTAGAT 
ATTCCGCGCG GAAAAATGGT TGTAATAACA GGACTCTCGG GTTCGGGTAA AAGTTCACTT 
GCGTTTGACA CAATTTACGC CGAGGGGCAA AGAAGATATG TTGAATCCAT GTCCGCTTAC 
GCCAGGCAAT TTTTGGATCT TATGGAAAAG CCCGACGTGG AACACATTGA CGGCCTTTCC 
CCCGCTATAT CTATTGAGCA GCGTAACCCA AGCAAAAACC CGCGTTCCAC AGTATCAACA 
GTAACGGAAA TTTATGACTA TCTGCGCCTG CTTTACGCGC GCGTGGGCCA CCGCCATTGC 
CCGCAGTGCG GGCAGGAAGT TGAATCCTGG AGCGTGCACG CTATAACTTC TGATATTTTA 
AAAAAGTTTA ATAACCAAAC CGTTTTTATA CTTTCCCCCA TAGTACAGGG CAGAACAGGA 
ACTTATGAGG AACTTTTTGC AAAACTCAAA AAAGACGGCT TTGTAAAAGT ACGGGTTAAT 
GGCGTTATTT CTAAATTAGA CACGGCGCCC GTATTAGAAA GATACAAAAA ACACACTATT 
GAAATTGTTG TGGACGAAGT TTTTGTCGAC GCGCTTGAAA AGGAACGTTT AACAGACTCT 
ATAGAAACCG CCGTAAAATA TTCAAAAGGG TTGGTATCGG TTTTTAACGC GGACGCAAAA 
CAACACTTTA CTTACAGTGA AAATAACGCC TGCGCAAAAT GCGGTATAGG TTTTAGCGAA 
TTGGAACCAA GATTATTTTC CTTTAACACG CCTTACGGCG CCTGCCCCGA ATGTAACGGT 
TTAGGCATTA AAATCGAAGT AGCCGAGGAC CTTGTAGTGC CGGACCCTTC GCTTACTTTA 
AACGAAGGCG CTATCGCCGC CTGGGACTCC CCCGTTACAA CACGCACCAA CCGTTGGAAA 
AACGGCTGGG CTGGTTATTA TTATGATATT TTAAAACAGG TTTGCCGCAA AAACAAAATA 
CCCATGGGCG TACCGTGGAA TAAGCTTACA AAAGCGCAAA GAAACATTGT TCTTTACGGC 
GGCAACGGCA CTACCTATAA AGCCTCCTGG GCTACAAATG AAAGTGAGTT TGAAGGCGTT 
ATAGGCAATT TAAACAGAAG GCACGCGGAG TCGGAATCAG ACTTTGTGCG TGAAGAAATT 
TACAACAGAT ATATGCGTGA GGTTACCTGC CCCGTATGCC ACGGCGCCAG ATTAAAGGCT 
GAAGCGCTTG CCGTGCATGT AGGCGGGCTA AATATATCTA AAGTAACGGA AATGCAAGTG 
GGCGAAGCCA TTAAATGGAT TGCCGGACTT GAGTTTAATG ATAAGGAAAA AATAATTTCA 
AAAGACGTTA TTAAAGAAAT TAAAAGCAGG CTTGGCTTTT TAAACAGCGT GGGTTTAAGC 
TACCTTACGC TTAACCGTAA AAGCCAAACA CTCTCGGGCG GGGAATCTCA GCGTATACAC 
TTAGCCACGC AAATAGGCAG CGGGCTGACG GGTGTGCTTT ATGTGCTTGA CGAGCCTACA 
ATAGGCCTTC ACAGCCGTGA TAATGACAAA CTTATCGAAA CGCTTAAAAA TCTGCGCGAT 
TTAGACAACA CTCTTATTAT TGTTGAACAT GATAAAGACA CTATTTTAGC GGCCGACCAT 
GTTATTGAAA TTGGCCCCAA GGCGGGTGAG CACGGCGGCA AAATTGTAGC TGAAGGAAGT 
TTGAAAGAAT TTTTAAAAGA TAAAAACGCA ATAACCGCTA AATATTTAAG CGGCGAGCTT 
AAAATAGCCC CTAACCTTAA CCCGAAAAAG CCAAACGGCA AATATATTGA AATTTCGGGC 
GCGGAACAAT TTAACCTAAA AAATATCAAC GTTAAAATAC CTTTAGGTTT ATTTGTTTGC 
GTGACGGGGG TGTCGGGCTC GGGCAAGTCA ACATTAATAC ACCAAATCCT TTATAAAGAA 
ATAGCCCAAA AATTTTACCA CGCCAAGGAT TTACCGGGTA AGCACAAAAA CATAAAAGGG 
TTGGAAAATA TTGACAAAGT TGTTATTGTA GACCAAACCC CCATTGGCAA AACCCCTCGC 
TCCAACCCCG CCACATACAC GGGCGTTTTT ACGCATATAA GGGAATTATT TGCCGAAATG 
CCTGAGGCAA AACGCCGCGG TTTTGCGCAG GGCAGGTTTT CCTTTAACGT AAAAGGCGGC 
AGGTGCGAAA AATGCGAGGG CGACGGCATT ATAAAAATTC AAATGCAGTT TTTGCCCGAC 
ATTTACGTAA AGTGCGAGGA ATGCAACGGC AAACGTTTTA ATGAGGATAC TCTTGCAGTG 
CATTATAAAG GAAAAAGTAT AGCCGATGTG CTGGAAATGA GCGTAAGCCA GGCTTTGGAA 
TTTTTTGACA CTATCCCTAA AATCAAAAAA GTTATACAAA CGCTTGACGA TGTTGGTTTA 
GGTTATATTA AACTGGGACA AAGCGCCACA ACATTATCCG GCGGTGAGGC GCAGCGCGTT 
AAACTTGCCC ACGAGCTAAG CCGCAGGGCC ACGGGCAAAA CTTTATATAT TTTAGACGAA 
CCCACCACAG GCCTCCATTT TGCAGATATT GACAAACTTT TAAGCGTACT ACACAGGCTT 
TCAGGCGCAG GTAATACTAT TTTGGTTATA GAACATAACC TTGATATTAT TAAAACAGCC 
GACTGGATTA TAGACCTCGG CCCCGAAGGC GGCGATAAAG GCGGTTATTT GGTGGCGGAA 
GGCACACCTC AAGATATTAG CAAAGCAAAA AACTCTTACA CGGGTAAATA TTTAAAAGAA 
GAAATGAAAT AA

Protein sequence

MQFIKIKGAK SHNLKNISVD IPRGKMVVIT GLSGSGKSSL AFDTIYAEGQ RRYVESMSAY 
ARQFLDLMEK PDVEHIDGLS PAISIEQRNP SKNPRSTVST VTEIYDYLRL LYARVGHRHC 
PQCGQEVESW SVHAITSDIL KKFNNQTVFI LSPIVQGRTG TYEELFAKLK KDGFVKVRVN 
GVISKLDTAP VLERYKKHTI EIVVDEVFVD ALEKERLTDS IETAVKYSKG LVSVFNADAK 
QHFTYSENNA CAKCGIGFSE LEPRLFSFNT PYGACPECNG LGIKIEVAED LVVPDPSLTL 
NEGAIAAWDS PVTTRTNRWK NGWAGYYYDI LKQVCRKNKI PMGVPWNKLT KAQRNIVLYG 
GNGTTYKASW ATNESEFEGV IGNLNRRHAE SESDFVREEI YNRYMREVTC PVCHGARLKA 
EALAVHVGGL NISKVTEMQV GEAIKWIAGL EFNDKEKIIS KDVIKEIKSR LGFLNSVGLS 
YLTLNRKSQT LSGGESQRIH LATQIGSGLT GVLYVLDEPT IGLHSRDNDK LIETLKNLRD 
LDNTLIIVEH DKDTILAADH VIEIGPKAGE HGGKIVAEGS LKEFLKDKNA ITAKYLSGEL 
KIAPNLNPKK PNGKYIEISG AEQFNLKNIN VKIPLGLFVC VTGVSGSGKS TLIHQILYKE 
IAQKFYHAKD LPGKHKNIKG LENIDKVVIV DQTPIGKTPR SNPATYTGVF THIRELFAEM 
PEAKRRGFAQ GRFSFNVKGG RCEKCEGDGI IKIQMQFLPD IYVKCEECNG KRFNEDTLAV 
HYKGKSIADV LEMSVSQALE FFDTIPKIKK VIQTLDDVGL GYIKLGQSAT TLSGGEAQRV 
KLAHELSRRA TGKTLYILDE PTTGLHFADI DKLLSVLHRL SGAGNTILVI EHNLDIIKTA 
DWIIDLGPEG GDKGGYLVAE GTPQDISKAK NSYTGKYLKE EMK