Gene Emin_1154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1154
Symbol
ID	6263770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1253072
End bp	1254607
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	38%
IMG OID	642611634
Product	TPR repeat-containing protein
Protein accession	YP_001876043
Protein GI	187251561
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	104
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAT TTTTATGTTT TTTAATTTTA TCCGCGCCGT TTTTTCTACA AGCGGCCGAG 
CCTGACTACG GCAAAACGTT TTATATGGAC TATATAAAAG GCCTTTTGCA TGTTAGCGAT 
AAAAAATATG ACAAGGCGCT TGATCATTTT GAGAAAAATT TAAAGGAATT TCCCGAGTCC 
GAGTTTCTAA AAACGCTTAT TTTGCAAACT GCAATAGCTG CCGGGAAAGA AGATAACTAT 
GAGGAAATAG CAAAAGAGGT TTCCCAATAT AAAGATAAAA ACTCTTTAAT TGCTTCCGCT 
GCTTACAGCT GGTCAAAAGG ACATTTGAAA GACGCTCTTT CTTATTATGA AAGCGCGCTC 
GCTTTGGATC CTGAAAATAC GGCTATTTTG GCCCAGTATC TTACGCTTTT AAACGGTATG 
GACAGTGAAA GAGCCGTGGC CTTTTTGGAA GAATACGCCG AAAAAGTGCC CGAACTTGCG 
GCGGTTATTT TTCAGGAAGC GGGCAATGTT AATTTGAAAA GGGGCCGTAC GGAAGACGCT 
CTTACCATGT ATTTTAAAGC AACGAAAGCA AACCCCCGAT ATGCGGAAGC CTATATAAGC 
CGGGCTGAAA TTTACCAAAA GCAGTCTAAA TTACAAGAAT CGCTTAAAGA ATATAAAAAA 
CTTGAAGACA TGGGTTTAGC GGACACGTAT GTTTACCTTA GAATAGGAAC GCTGCATGTT 
CTTTTAAAAA ATATTCCTGA AGCAAGAAAA TATTTTGAAA AAATTTTATC TTATGATCCT 
TCCAGCATTT TGGCCAACCA GTTCATGGCT GCTATATCGG AGGATGAAAA AAATTATGCT 
GCCGCTTTAA AATATTTGCA AGCGGCCGGA GATTACAAAA CCAATGCTTC AAAACTTTTG 
CAGGCTTCTT TTTACGCGGC GAGAATGGGA AATGCGGAAG AAGCGTCATC CATTTTAGAT 
AATGCTTACA AAGTATCCGA TAAAAGCGTT GAGGTAGGTT ATTTTTATGC GGTGTCTTTG 
CAAGATTTAG GTAAGCATAA GGAAGCTGTT AAAATTTTTA AAGAGATTTT GTCCCAAACT 
CCGCAATATG AAAAAGCGCG TATGATGTAC GGCGTTTCTT TAGACGCTTT GGGCGATAAC 
GCGGAGCTTG AAAAACAAAT GAGAATAGTT GTAGGGCAAA ATCCCGCTAA TTCCGAGGCT 
CTAAACTCTT TAGCCTACGC GTTGCTTGAG CAAAACAAAA AACTAAAGGA AGCTAAAAAA 
CATATTGACA GATCACTACA GCTTAAGCCT GACGATTATG CAACCATTGA TTCACTGGGA 
TGGTATTATT ATAAAACTAA AGATTATGAT AAAGCGCTTG AATATTTTGA AAAAGCTTTG 
TCCAAAATGC CGGACGATAA AGTTATAGCT GGGCATAAGG GGCTTGCTCT GTACCGTTTG 
GGAAGGTATA AAGAAGCTTT GCCGTGGATT ATAAAGGCTG AAGATAAAAA GCTAAATAAG 
TATATAAAAA AAGCAGAAAA AAAATCGGGG GAATAA

Protein sequence

MKKFLCFLIL SAPFFLQAAE PDYGKTFYMD YIKGLLHVSD KKYDKALDHF EKNLKEFPES 
EFLKTLILQT AIAAGKEDNY EEIAKEVSQY KDKNSLIASA AYSWSKGHLK DALSYYESAL 
ALDPENTAIL AQYLTLLNGM DSERAVAFLE EYAEKVPELA AVIFQEAGNV NLKRGRTEDA 
LTMYFKATKA NPRYAEAYIS RAEIYQKQSK LQESLKEYKK LEDMGLADTY VYLRIGTLHV 
LLKNIPEARK YFEKILSYDP SSILANQFMA AISEDEKNYA AALKYLQAAG DYKTNASKLL 
QASFYAARMG NAEEASSILD NAYKVSDKSV EVGYFYAVSL QDLGKHKEAV KIFKEILSQT 
PQYEKARMMY GVSLDALGDN AELEKQMRIV VGQNPANSEA LNSLAYALLE QNKKLKEAKK 
HIDRSLQLKP DDYATIDSLG WYYYKTKDYD KALEYFEKAL SKMPDDKVIA GHKGLALYRL 
GRYKEALPWI IKAEDKKLNK YIKKAEKKSG E