Gene Emin_0197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0197
Symbol
ID	6262985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	206957
End bp	208270
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	44%
IMG OID	642610661
Product	excinuclease ABC subunit C
Protein accession	YP_001875098
Protein GI	187250616
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTTA ACTTTAATAT TTTACCAAAA TCTCCCGGTG TATACATAAT GCGTTCCGGC 
CTGGGCGAGG TTTTGTATAT CGGTAAAGCT AAAAATTTGG CGGCGCGCGT GCGGCAGTAT 
TTTTTGGAGT CTAACCTCCA TAGCCGCGGC TGGCTTTTGC CGAGTTTGCT GCCGCTTGTG 
GCCAAAATAG ATTATATTGT GGCGGCCAGC GAGCGGGACG CTTTGGTGCT TGAAAGCCGT 
CTAATAAAGA AATACAAACC TTTTTTTAAT ACCGATGGTA AAGACGATAA ATCTTATCCT 
TATATAAAAA TAAGCGATGA AGATTTCCCC AGGGGATTGC TGACTAGAAA CAAAAAAGGA 
CCGGGCGAAT ATTACGGTCC GCACCCCAAC GCTTTCGCTA TTAAAAGTCT TTTGCGTTTT 
TTGTGGACAA GCGGTTTTGC CCCGTTAAGG CCGTGTAAAT GGAATTTCAG CCTTTCTAAA 
CCGTTAGACG AACGTAAAAT AAGAACTTGC GTTTATTTTC ACACAGGGCA ATGCCCCGCT 
CCCTGCGCGG GAAAAATTTC TTATAAGGAT TACCAAAAAA TAGTGCAGCG GTTTAGGGAT 
TTCGCAGAAG GCAATTTCGG TAAAATGAAA CACGGTTTGG CAAAAGCCAT GAAAATGGCC 
AGTAAAAATA TGGATTATGA ATCAGCCGCC AGGTACAGAG ATTTTTTAAA CACCTTAGAA 
CGCATGTCCG AACGCATTTT GGTAAGTGAA TATAAGGACG AAAAAATATT GTCAGCCATA 
GACGCGTCTT CTAAAGTAAA AAGGCTGGGC GAAGTTTTGG GCTTTGCCAA AGTGCCCAGG 
CATATAGAAA CTTTTGACAC TTCTGGTCTT TACGGGCGTT ACGCGGTAGG CAGTATGGTT 
TGTTATATTG ACGGTAAAAA ACATCACGCG CATTACCGCA GGTTTAAAAT TAAGTCCGTT 
TTGCCCGGCA CCGGCAATGA CGACTTTTTG ATGATGACGG AAATTGTGGG CAGACGCCTT 
GCGGCCTTAA AAAAAGCTGG CGGCGCGCTA CCTGATTTAA TGGTTATTGA CGGCGGGAAA 
GGCCAGCTTG GTATGGCTGA AGCCGCAGCC CAAAGAGCGG GTGTTAAAAT GAAATTTATT 
TCCTTAGCTA AACGGGAAGA AGAAATTTTT GTTACCGGCC GCAGCGAAAG CATTAAACTG 
CCTATAGGCG ATCCTGCCTT AAACCTGCTT ATGGAAATGC GAGACGAGGT GCACCGCTTC 
GGCATAACTT ACCACAGGCA TTTGAGAGAC AAAAATTTAT TGGAAGATAA GTAG

Protein sequence

MSVNFNILPK SPGVYIMRSG LGEVLYIGKA KNLAARVRQY FLESNLHSRG WLLPSLLPLV 
AKIDYIVAAS ERDALVLESR LIKKYKPFFN TDGKDDKSYP YIKISDEDFP RGLLTRNKKG 
PGEYYGPHPN AFAIKSLLRF LWTSGFAPLR PCKWNFSLSK PLDERKIRTC VYFHTGQCPA 
PCAGKISYKD YQKIVQRFRD FAEGNFGKMK HGLAKAMKMA SKNMDYESAA RYRDFLNTLE 
RMSERILVSE YKDEKILSAI DASSKVKRLG EVLGFAKVPR HIETFDTSGL YGRYAVGSMV 
CYIDGKKHHA HYRRFKIKSV LPGTGNDDFL MMTEIVGRRL AALKKAGGAL PDLMVIDGGK 
GQLGMAEAAA QRAGVKMKFI SLAKREEEIF VTGRSESIKL PIGDPALNLL MEMRDEVHRF 
GITYHRHLRD KNLLEDK