Gene Emin_0286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0286
Symbol
ID	6262849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	304952
End bp	306217
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	42%
IMG OID	642610751
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_001875184
Protein GI	187250702
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAAAC AACATATTGA AACTTTGGCC GTATCATACG GCTTTGAAAT TGACGAAACG 
GGATCAAGCA ACCCGCCGTT ATATCTTTCA AACGCTTATA AATTTAATGA CGCTAAACAT 
GCAAAAGACC TGTTTGACCT CAAAGCCCCG GGTTATATTT ACACAAGGCT AAACAACCCG 
ACAAACAATT TTTTGGAAGA AAGAATTAAC GCTCTCGAAG GCGGCGCGGG AACATTGGTA 
ACGGCTTCGG GCCATTCGGC CGAGTTTATG ACAATATGCG CCCTTGCCGA AACGGGCGAC 
GAAATAATTT CCTCTAACGC TTTATACGGC GGCACATTTA ACATGTTTTC CCATTCGCTC 
CGCCGTTTGG GCATAAAAGT AAAATTTGCC GATGTTTCAA ACCCCGCCGA GTTTGAAAAC 
CTGGTAACGG ATAAAACAAA AGCCATTTTT GTTGAGTCCA TAAGCAACCC CGGCTGTGAG 
ATACCTGACT TTGAGCAACT TTCCAAAATA GCTAAAAAAC ATAAAATCCC CTTTATAGTT 
GATAATACCT GCATGACCCC ATACCTTTTT AAACCCAAAG ATTTCGGCGC GGATATAATA 
ATACATTCAA CCACAAAGTT TTTGTCGGGC CACGCGGCGG TGATGGGCGG CTCTGTAACG 
GATTGCGGCA CTTTTGACTG GACAAGCGGG CGTTTCCCCT CTTTTTGCAA CCCCGACCCA 
AGCTACCACA ATATAGTTTA CGCCAAAGAT TTTGCACAAA ACGCTTTTAT AGTAAAACTG 
CGCACCCAGG TTTTAAGAGA TATCGGAGCG TGCCAAAGCC CTTTTAACTC TTATCTTACA 
TTGCAAGGCA TACAAACTCT TCATGTGCGT ATGGACAGAC ATTTGGAAAA CACTCTAAAA 
CTTATTGATT ACTTAAAAAA TAATCCCAAA ATAGCGTGGG TAAAATACCC GCTTGTAGAA 
GGGAATCCTT TTAAACAAAC GGCTGAAAAA TATTTTAAAA AAGGTTGCGG GTCGCTTTTT 
TCCTTTGGGT TAAAAGGCGG TTATGAAGCG GGAAAGAAAC TAATAGAAAA CGTAACCCTT 
TGCCTGCACG CCACAAATTT AGGAGACGTA AGGACAATAG TCACTCACCC GGCCAGCACA 
ACGCACAGCC AGTTAACGAA GGAAGAAAAA CAAAAAACGG CAATAGGCGA TGACCTTATA 
AGGATTTCCG TAGGCATTGA AAATATTGAT GACATTATAG CCGACTTGGA GAAAGCGCTT 
ATATGA

Protein sequence

MTKQHIETLA VSYGFEIDET GSSNPPLYLS NAYKFNDAKH AKDLFDLKAP GYIYTRLNNP 
TNNFLEERIN ALEGGAGTLV TASGHSAEFM TICALAETGD EIISSNALYG GTFNMFSHSL 
RRLGIKVKFA DVSNPAEFEN LVTDKTKAIF VESISNPGCE IPDFEQLSKI AKKHKIPFIV 
DNTCMTPYLF KPKDFGADII IHSTTKFLSG HAAVMGGSVT DCGTFDWTSG RFPSFCNPDP 
SYHNIVYAKD FAQNAFIVKL RTQVLRDIGA CQSPFNSYLT LQGIQTLHVR MDRHLENTLK 
LIDYLKNNPK IAWVKYPLVE GNPFKQTAEK YFKKGCGSLF SFGLKGGYEA GKKLIENVTL 
CLHATNLGDV RTIVTHPAST THSQLTKEEK QKTAIGDDLI RISVGIENID DIIADLEKAL 
I