Gene Emin_1068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1068
Symbol
ID	6263434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1161342
End bp	1162577
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	37%
IMG OID	642611548
Product	hypothetical protein
Protein accession	YP_001875957
Protein GI	187251475
COG category	[L] Replication, recombination and repair
COG ID	[COG2887] RecB family exonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	93
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACACT TTATTATCAG AACTTTAATA AAGGGCAGTA AAATGGCTAC ATCTAAACTT 
TCGTTTTCCT ATTCTAAAAT GACGCTTTAC CGCGAGTGTC CGCAAAAATA TAAATTCCGT 
TATATACATA AAATACCGGA AGCTCCCAAA TATTATTTCG CGTTCGGTTC GGCCATGCAT 
AAAGCGCTTG AGTTTATTTA CAGCGTTAAA CAGCCGCCGT TTCCTTCCTT AGAACAAATT 
TTAGATTTTT TTGACGCCGA TTGGCGCAGC ACAAGTTATC AGGACAAAGG CTATGCCAGC 
ATTTCCAAAG AGCTTGAAGG ATACGACGAA GGCCGCCGCA TTTTAATATC TTACTACCAA 
AAACATAAAG ACAGTTTTTT TATTCCTTTA GCCGTTGAAT TTAGAACAAC TTTAGATATT 
GATAATCTTT CCCTCATAAG CATTATTGAC CGTGTTGATT ATTTTGGCAA CGGAGCGTTG 
GCGATTACGG ATTATAAAAC TGGCAAAACC GTACAGCGCG AGCCCGACCA GCTTTATATG 
TACCAAAAGG TAATGCAAAA CTCTCCTGTT TTAAAAAACA TCATAAATGA AAAAGAGGGC 
AAAGAAACGG AAGTAAAAAT TGAAAAACTT TCCTTTTACC ATTTACCGTC ATTAAAAGTT 
ATGGATTTTG AGCCCGCCCC CCAAAAAGAA ATTGATGTTT TTTGGGAAGG CGTTTTAAAA 
ACCGCCGATG AAATACGCGG CAAAAACTTT AACCCAGATC CTTCCGAAAG CAAATGCCGC 
TGGTGCGATT ACAAAGCAAT GTGCCCTGTT TTTACGGGTA TGGAGTTTGA GCAGTTTCAA 
AAAACGGAAA AGCCTGTATT TTCAGATATC CCGGTAACAA ATGAGGATAT TTTATCTTCA 
AAAATAGACG AACTTGCCGA AACGGGGCAA AAATATTCTT CTTTAAAAAA AGAAATTATT 
TCCTTAATGA AACAAAACAA CTACAACCAA CATTTCGGCT CAAATTACAA AGTTGAGCTT 
AAACAAAAAG AATTTTTAGA TTTTGAAGAC AAAGAAAAAG TTATAGAATT TTTAAAAGAA 
AAAAATCTTA TTAAAAAAAC GCTTGTACCT ACGCAATGCT CAATAGAAGC GCTTTTGGAC 
GACCCTTCCG TACCGGAAGA CGATAAAGCC CGCCTTAAAG AGCTTGGCGT TAACCGCGTT 
TCGGACGAGC TTCAAATAAA AAAGGTTGAA AAATAG

Protein sequence

MIHFIIRTLI KGSKMATSKL SFSYSKMTLY RECPQKYKFR YIHKIPEAPK YYFAFGSAMH 
KALEFIYSVK QPPFPSLEQI LDFFDADWRS TSYQDKGYAS ISKELEGYDE GRRILISYYQ 
KHKDSFFIPL AVEFRTTLDI DNLSLISIID RVDYFGNGAL AITDYKTGKT VQREPDQLYM 
YQKVMQNSPV LKNIINEKEG KETEVKIEKL SFYHLPSLKV MDFEPAPQKE IDVFWEGVLK 
TADEIRGKNF NPDPSESKCR WCDYKAMCPV FTGMEFEQFQ KTEKPVFSDI PVTNEDILSS 
KIDELAETGQ KYSSLKKEII SLMKQNNYNQ HFGSNYKVEL KQKEFLDFED KEKVIEFLKE 
KNLIKKTLVP TQCSIEALLD DPSVPEDDKA RLKELGVNRV SDELQIKKVE K