Gene Emin_0529 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0529
Symbol
ID	6262717
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	578900
End bp	580126
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	39%
IMG OID	642610999
Product	peptidase T
Protein accession	YP_001875421
Protein GI	187250939
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00086333
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.062594
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTTTA AACAAAATAT TTTAGAGAAA TTTTTGAGAT ATGTAAAAAC AGAAACCACT 
TCCGATACGG AATCATCATC AAAACCTTCA ACAAAAACCC AGCTTGAATT CGCGGCTGTA 
CTTGCCAAAG AAATGGAAAC CCTGGGTATT AAAGATATAA AAATATCTAA AACAGGGCAT 
TTAACCGGTT CCATACCCGC AAATAATGAC GCCAAAGCGC CTACAATAGG GTTTATAGCG 
CATATAGATA CATCCCCCGA TTTTAACGGT AAAAACGTTA ATCCGCAAAT ACATAAAAAT 
TACGCGGGCG GAGCTATTGT TATAAATAAA GATAAAAATA TGTCAATTTC GCCTGAAATG 
GACAAAATTC TTAATGACGT AACAGGCCAC GACATTATAA CAACCGATGG AAATAGCCTT 
TTAGGCGCGG ATGATAAAGC GGGTATAGCT ATTATAATGA CAATGGCCCA ATATTTAAAG 
AATAATCCAT CCTTTAAACA CGGACCCGTA AAAATAGCTT TTACACCTGA TGAGGAAATA 
GGCACGGGCA TTTTGGATTT TGATGTCGCG GACTTTAAGG CTGACTTCGC TTACACCGTT 
GACGGCAGCG TTATGGGTGA AATAGAAAAC GGCAACTTTA ACGCCGATAA GTTTAAAATT 
GAAATAACCG GCGTTAACTG CCACCCCGGC ACGGCTAAAG ACGTTATGGT CAACCCCGTG 
AGAGTAGCGG CTGATTTAAT AAACCGCTGG CCTGAAAGCA AACTGCCTGA AACCACGGAA 
GGAGAGGAAG GCTTTATACT TTTTAACACA TTAAAAGGGA ATATCGAAAA AACCGAAATA 
GGCGGTATTA TAAGGGAGCA TGATTTAAAA AAACTTACGG ATTTAGAAGA CTCTCTTAAA 
AAAATTATTG AAGATACTAA AGCTAAATTT AAAGGAGCGC AGATTAAGTT AACAATAAGC 
GAGCAATACA GAAATATGAA AGACGTACTT GCAAAAAACC CCGAAGCCAT GAATAAACTT 
TTAAGCGCTT TAGAAGATAT GGGTATTAAA TATAAAATAA GCCAAATAAG GGGCGGCACC 
GACGGGGCCA GGCTTTCTTT TATGGGTTTG CCGACGCCAA ATATTTTTGC CGGCTATTCA 
CAGCCGCACG GACCGTATGA ATGGGCTTCT TTAGACGCTA TGGCTATAGC TTGCAAGTTT 
ATATTAAAGA TAGTCGAAGT AAAATAG

Protein sequence

MDFKQNILEK FLRYVKTETT SDTESSSKPS TKTQLEFAAV LAKEMETLGI KDIKISKTGH 
LTGSIPANND AKAPTIGFIA HIDTSPDFNG KNVNPQIHKN YAGGAIVINK DKNMSISPEM 
DKILNDVTGH DIITTDGNSL LGADDKAGIA IIMTMAQYLK NNPSFKHGPV KIAFTPDEEI 
GTGILDFDVA DFKADFAYTV DGSVMGEIEN GNFNADKFKI EITGVNCHPG TAKDVMVNPV 
RVAADLINRW PESKLPETTE GEEGFILFNT LKGNIEKTEI GGIIREHDLK KLTDLEDSLK 
KIIEDTKAKF KGAQIKLTIS EQYRNMKDVL AKNPEAMNKL LSALEDMGIK YKISQIRGGT 
DGARLSFMGL PTPNIFAGYS QPHGPYEWAS LDAMAIACKF ILKIVEVK