Gene Mmcs_1850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1850
Symbol
ID	4110684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	1993235
End bp	1994275
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	68%
IMG OID	638030970
Product	2OG-Fe(II) oxygenase
Protein accession	YP_639015
Protein GI	108798818
COG category	[R] General function prediction only
COG ID	[COG3491] Isopenicillin N synthase and related dioxygenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.617074
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGGGG CAACGTCATT CACCTCCGTG CCGACCGTCG ATATCAGTGG GCTGCAGTCG 
GACGACCGTG CCGAGCACGA ACGCGTCGCG GCCGACCTCG GCGCCGCGGC CCGTGACGTC 
GGCTTCTTCT ACATCAGCGG ATCGGGTATC GACGAATCGT TGTTCGACCG GATGCTGGCC 
GCGACGAAGG AGTTCTTCGC GCTGCCGCTC GAGGAGAAGA TGCGCACCTA CATCGGTCTG 
TCCCGCTGCC ACCGCGGGTA CGTGCCGGTC GGCGAGGAGG GCGTCGAGCA GGACACGCCG 
GACTTCAAGG AGGCGTTCGA CACCGCGCTG GACCTGCCGG GCGACGACCC CGACTATCTG 
GCGGGCAACC CCATGCTCGG TCCGAACGCC TGGCCCGATC TGCCCGGCTT CGCCGAATCG 
GTGACCGCCT ACTACACCGC GGTGCTCGAA GTGGGGCAGC GGCTGCTGTG GGCGTTCGCG 
ATCGCGCTGG GGGAGGACCC CGACGTCTTC ACCAGGCACG CGACGAAGAC GCCGAGCCAA 
CTGCGGCTGG TGCACTACCC CCACAACCCG GATGCCGAGG ACCGCATGGG CATCGGCGCG 
CACACCGACT ACGAATGCTT CACGCTGCTC AAACCCACCG CACCGGGGCT CGAGGTGCTC 
AACGGCGCCG GCGAGTGGAT CGACGTGCCC CCGGTGCCGG GCACATTCGT CGTCAACATC 
GGCGACATGC TCGAACTGTG GACCAACGGC GCGTTCGTCG CCACCAGCCA CCGGGTGCGC 
AAGGTCAAGG AGGAGCGGTA CTCGTTTCCG TTGTTCTTCA ACGTCGACTA CCACACCGAG 
GTCAAACCGC TGCCGCAGTT CGCCCCCCGC GACGACCGGC CGCGTCCGGC GCTGCGGGCC 
GGTGAGCACC TGTTCGCCCA GACCGCGCAG TCCTTCGCCT ATCTGCGCCG CCGGCTCGAC 
AGCGGGGAAC TGGTCCTGCC CGAGGGGTCG CTGGCGCCCG GCCAGTTCGG CCAGCAAGCG 
CTGCAGGGCA CGACTAGTTG A

Protein sequence

MNGATSFTSV PTVDISGLQS DDRAEHERVA ADLGAAARDV GFFYISGSGI DESLFDRMLA 
ATKEFFALPL EEKMRTYIGL SRCHRGYVPV GEEGVEQDTP DFKEAFDTAL DLPGDDPDYL 
AGNPMLGPNA WPDLPGFAES VTAYYTAVLE VGQRLLWAFA IALGEDPDVF TRHATKTPSQ 
LRLVHYPHNP DAEDRMGIGA HTDYECFTLL KPTAPGLEVL NGAGEWIDVP PVPGTFVVNI 
GDMLELWTNG AFVATSHRVR KVKEERYSFP LFFNVDYHTE VKPLPQFAPR DDRPRPALRA 
GEHLFAQTAQ SFAYLRRRLD SGELVLPEGS LAPGQFGQQA LQGTTS