Gene Emin_1329 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1329
Symbol
ID	6263546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1430438
End bp	1431478
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	42%
IMG OID	642611808
Product	radical SAM domain-containing protein
Protein accession	YP_001876216
Protein GI	187251734
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00000017523
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTGAAA TAATAAAAAA GGCCGCCAAA ACAAATAACC TTACGGAAGA AGAAATAACG 
CTGCTTTTAG AAAATTCCTC TTTTAACGGG GAGCTTTTTG CCGCGGCCGA TTTTACGCGC 
AAGCAAAATG TGGGTGACGG CGTGCATCTG CGCGCTTTAA TAGAATATGG GAATATCTGC 
CAAAACAACT GTTTTTACTG TGGCATAAGG GCCGCTAAAA AAGATGTAAA AAGATACCGC 
CTGGACACGG AAACCACGCT AAAAGCCGCC GCTTTGGCAA AAAACCTGGG TTACAAAACA 
ATTGTTTTGC AATCAGGTGA GGAAAACGCC GCTCCTTTAA ATGAATTTTT GCAAATTATA 
AAAGAAATTA AGAATATGGG CCTTGCCCTT ACTTTAAGCA TTGGTGAAAA AACTTACCAA 
GAATATCTTG CTTACAGAGA AGTCGGCGCG GATAGGTTTT TACTGCGTAT TGAAACAACG 
GACGAAAATT TGTACCAAAC ACTTCACCCT GGTATGAATT TGCAAAACAG GCTGCGCTGC 
CTTAAGGATA TAAAAAAGCT GGGTTATGAA ACAGGCACAG GCATAATGGT AGGGTTGCCG 
GGCCAGACGG CAAAATCAAT AGCGAAAGAT ATTTTATTTT TTAAAGAGCT AGACGCCGAC 
ATGCTTGGCA TAGGGCCGTT TATCCCATGC CCCGGCACCC CTTTGGAAAA TGAAAAGGGC 
GGCAGTTTGG AAACAGCTTT AAAAGTTATG GCGATATCAC GCCTTATTAT GCCAAAAATA 
AATATCCCGG CCACAACAGC TATGGAAGCT ATTGAAAAAA ACGGACGGAT AAAAGCATTG 
CAAAGCGGAG CAAATGTAAT AATGCCAAAT GTTACACCAC AAAACGAGCG CAAAAATTAC 
GCCCTTTATC CCGGAAAACC GGGCATTTTG CAAACTCCTG AAGAGTTCTT AAATAGCCTT 
AAGCAAACGC TTAGCCAAAT AGGCCGTTTT GTATCGCAAG ACGCGGGCAT GAGTTTAAAC 
TACCGTCCTA TAGAAAAATA G

Protein sequence

MREIIKKAAK TNNLTEEEIT LLLENSSFNG ELFAAADFTR KQNVGDGVHL RALIEYGNIC 
QNNCFYCGIR AAKKDVKRYR LDTETTLKAA ALAKNLGYKT IVLQSGEENA APLNEFLQII 
KEIKNMGLAL TLSIGEKTYQ EYLAYREVGA DRFLLRIETT DENLYQTLHP GMNLQNRLRC 
LKDIKKLGYE TGTGIMVGLP GQTAKSIAKD ILFFKELDAD MLGIGPFIPC PGTPLENEKG 
GSLETALKVM AISRLIMPKI NIPATTAMEA IEKNGRIKAL QSGANVIMPN VTPQNERKNY 
ALYPGKPGIL QTPEEFLNSL KQTLSQIGRF VSQDAGMSLN YRPIEK