Gene Emin_0434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0434
Symbol
ID	6262571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	464695
End bp	466089
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	43%
IMG OID	642610904
Product	TPR repeat-containing protein
Protein accession	YP_001875328
Protein GI	187250846
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA TAATTTATAT ATTTTTACTT TTGCCTTTTA TTTTTGCCTG TTCGGAAACA 
ACGGATTTAG GGCGTGAGGA TAATGTGCCC CCCGCTTTAG AGTCTGTTTT TAAATCCGCC 
AAAAAAGGCG ATGCTGAGGC GCAGCTTAAA ATTGCCAAAG CGTATTTTGA CGGGCTGGAA 
GGCATGCCGT TAAATTATGA AAAAGGGTTT TATTGGGCGC AGAAATCAGC CAAAGGCGGT 
AATAATGACG CTTTACGCGA GGTTGGCTTT TCCTATCTGA ACGCGCGCGG CGTAAAAAGG 
GATTTTAGAA CCGCGCTTAA ACATCTTACC AACGCGGCTG ACTCTGGTAA CGTTCAGGCA 
ATGTTAGATA TAGCGGCTTT ATATTACGAT TTAAAAAAGC CTAGAGAAGA GTATGAGTGG 
TATGAAAAAG CGGCCGCTTC AGGCGCGGAG GCGGGTATGC AAATTTTAGT TGACCGCTAC 
TGCTACGCCG CAAGGAAAGA CGGGGAAAAA TGTTTAATTT GGCTTACAAA ATTAGCTGAC 
GGCGGCTCTA TTGAAGCTAT GAAACAGCTG GCACAAATTT ATGAAAAAGG CGAAATTACC 
GCCAAAACGC TTGAAAAAAC AGAGTATTGG TATGAACGCG CCGCCCAAGC GGGGGACGTT 
GAGGCTATGA GCTTGGTAGG CCAGGCGTAC GCTTTGGGCA GCATGCACAC AAAAGATGCT 
AAACTCGCTT TTAAATGGAA TTTAGAGGCC GCCAAGCAGG GTAATGAAAA AGCAATTTTC 
GCTTTATGCA GTTCGTATAT TTACGGGCAG TTTACCTCTA AAGACATGAA AAAAGCCGTG 
GAATGGTGCA CAAAAGCGGC TGAAAAAAAC AGCGTTAAAG CCATGTATTA TTTAGGCATA 
ATTTATGAAA GGCCCTACGC TCCCGTAAAA AAAGATCTTC CTAAGGCCGT ATCCTGGTTT 
ACCAAAGCTG CACAAGCGGG GGACGGCTCT TCCATAGGGG AGCTGAGTCT TTATTATTTA 
AAAGCAAAAA ATTATGATAA AGCCTTTGAG TGGGCTTCCA AAGGGGCATT GCTTGATAAT 
GAACAGTCGG CCTATGTTTT GGGCCATCTT TACATGCATG GACTAGGCGT AAAAAAGGAT 
TTGGCACAGG CTTTAAAATG GAATACTAAA GTGGTTTCTT TAAATAAAGA AAATTTTTTA 
TATATGTATA ACCTGGCTGA AGTTTACACT GCGCAGCGTA AATATTCAAA CGCTTTTACG 
TGGTATTTGC GCGCCGCGAA AGCCGGGCAT GAACCTTCCA TGAAAGAACT TGTTGTTATG 
TATGTAGCCG GCAGAGGTAC GGAAAAAAAC CTTGACGCTG CCCGCTATTG GCAAAAAAAG 
ATTGAAGGAA AATAA

Protein sequence

MKKIIYIFLL LPFIFACSET TDLGREDNVP PALESVFKSA KKGDAEAQLK IAKAYFDGLE 
GMPLNYEKGF YWAQKSAKGG NNDALREVGF SYLNARGVKR DFRTALKHLT NAADSGNVQA 
MLDIAALYYD LKKPREEYEW YEKAAASGAE AGMQILVDRY CYAARKDGEK CLIWLTKLAD 
GGSIEAMKQL AQIYEKGEIT AKTLEKTEYW YERAAQAGDV EAMSLVGQAY ALGSMHTKDA 
KLAFKWNLEA AKQGNEKAIF ALCSSYIYGQ FTSKDMKKAV EWCTKAAEKN SVKAMYYLGI 
IYERPYAPVK KDLPKAVSWF TKAAQAGDGS SIGELSLYYL KAKNYDKAFE WASKGALLDN 
EQSAYVLGHL YMHGLGVKKD LAQALKWNTK VVSLNKENFL YMYNLAEVYT AQRKYSNAFT 
WYLRAAKAGH EPSMKELVVM YVAGRGTEKN LDAARYWQKK IEGK