Gene Emin_0047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0047
Symbol
ID	6263261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	49347
End bp	50960
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	43%
IMG OID	642610510
Product	hypothetical protein
Protein accession	YP_001874952
Protein GI	187250470
COG category	[S] Function unknown
COG ID	[COG1543] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.666843
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	94
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGAAA AAGGTTATTT AGCTTTAGTC CTTCACGCGC ATTTGCCGTT TATCAAACAC 
CCGGAATATC CTGACTTTTT GGAAGAAGAC TGGTTTTTCG AAGCGATGGT TGAAACATAC 
CTTCCGCTTT TAAATATGTA TGAAAAGTTA ACTGCTGAAG GTGTTGATTT CAGAATAACA 
ATGTCCTTAA CGCCGCCGCT TTGCGCTATG ATGAGCGACC CGCTTTTAAT AAGCCGCTTC 
AGATATTACC TTAACGCCAG AATAGAATTA AGCCAAAAAG AGCTTGTGCG CACAAAAAAC 
ACAGAGTTCC AGTATGTGGC GCAAATGTAC GCAGATAAAT TTGCAAGATT TAAAGATTTG 
TTCGAAAACT ATTACCACGG CAATATTTTG GAAGGTTTTA AAAAATTCCA AGATATGGGC 
AAATTAGAAA TTATAACCTG CTGCGCTACG CACGGCTATT TGCCTCTGCA GGTGCATAAG 
GAAAGCGTTA ACGCACAAAT TAAACTGGCG GCGGACGATT ATAAAAAACG CTTCGGCAGG 
CAGGCAAGAG GTATTTGGTT GGCAGAATGC GCTTATAACC CAGGCGACGA TAGGTTTTTA 
AAAGCCAATG GCATAAGGTA CTTTTTTACA GAAACGCACG GCATTTTACA CGGTGTTCCA 
CGCCCTAAAT ACGGTATTTA CGCGCCGGTT TACACGCCCA GCGGAGTAGG CGTTTTCGCA 
AGGGATATGG AAAGCGCCCA GCAGGTCTGG AGCGCGGAGT CCGGCTACCC AGGCGACCAG 
TCTTACAGAG AATTTTACCG TGATTTAGGC TATGACCTTG ATTATGATTA CATTAAGCCA 
TACCTTCACA GCGACGGCGT GCGCAGAAAT ATAGGCATGA AATACCACCG TATTACAGGC 
AAAGTTTCTT TAAGCCAAAA AGACACTTAT TACCCTTCGG ACGCGAAAAG TAAAGCCGCA 
GAACACGCGG GCAACTTTAT GTTTAACCGC CAGAAACAAA TTGAGTACCT ATCCACTTTA 
ATGGACAGAA AACCTTTGGT AGTTTCAATG TATGACGCCG AGCTTTACGG CCACTGGTGG 
TATGAAGGCG TTGATTTCCT TGAATATCTG TTTAAAAAAC TGCATTATGA CCAAAGTGAC 
ATTAAGCTTA TAACACCTTC GGAATATTTA TCTAAATATC CGGAAAACCA GGTTGTTGGG 
CCCAGCGCGT CCTCATGGGG CGACAAGGGG TACAACGATG TTTGGCTTAA CAGCGGTAAT 
GACTGGGTTT ACAGGCACCT TATTAAAGCG GCTGAACGCA TGATGGAAAT GGCTAATTAC 
TACCCTAACG CGGAAGGCCT TCTGAAAAGA GCCTTAAACC AATGCGCCAG AGAGCTTGTG 
CTTATGCAAT CCTCCGACTG GGCGTTTTTA ATGACGGTAG GCACCGCGCA GCAGTATTCG 
ACAAAGCGCA CAAAAGAACA TATACAGCGC TTTAATGAAT TATACGAGCA AATTAAAAAC 
AACAGAATCG ACGAAGCTTA TATCTACGGA CTTGAAACAA AGGACAGTAT TTTCCCTGAG 
ATTGACTACA AGGTTTATAT GTCTGAACTT AAAGATAAAG CTTTAGCTTC CTAA

Protein sequence

MEEKGYLALV LHAHLPFIKH PEYPDFLEED WFFEAMVETY LPLLNMYEKL TAEGVDFRIT 
MSLTPPLCAM MSDPLLISRF RYYLNARIEL SQKELVRTKN TEFQYVAQMY ADKFARFKDL 
FENYYHGNIL EGFKKFQDMG KLEIITCCAT HGYLPLQVHK ESVNAQIKLA ADDYKKRFGR 
QARGIWLAEC AYNPGDDRFL KANGIRYFFT ETHGILHGVP RPKYGIYAPV YTPSGVGVFA 
RDMESAQQVW SAESGYPGDQ SYREFYRDLG YDLDYDYIKP YLHSDGVRRN IGMKYHRITG 
KVSLSQKDTY YPSDAKSKAA EHAGNFMFNR QKQIEYLSTL MDRKPLVVSM YDAELYGHWW 
YEGVDFLEYL FKKLHYDQSD IKLITPSEYL SKYPENQVVG PSASSWGDKG YNDVWLNSGN 
DWVYRHLIKA AERMMEMANY YPNAEGLLKR ALNQCARELV LMQSSDWAFL MTVGTAQQYS 
TKRTKEHIQR FNELYEQIKN NRIDEAYIYG LETKDSIFPE IDYKVYMSEL KDKALAS