Gene Mmcs_4989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_4989
Symbol
ID	4113818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	5275229
End bp	5276425
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	70%
IMG OID	638034147
Product	cysteine desulphurase-like protein
Protein accession	YP_642149
Protein GI	108801952
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01976] cysteine desulfurase family protein, VC1184 subfamily

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATACG ACGTCGCCCG GGTGCGTGGA TTGCACCCCT CATTGGGCGA CGGTTGGGTG 
CACTTCGACG CCCAGCACGG GATGCTGCTG CCCGACGCGG TGGCCACGAC GGTCTCCACC 
GCGTTCCGGG GGTCGATGTC GACCACCGTG GGCCCGCATC CGTCGGCGCG GCGCAGCGCC 
GCGGTGCTGC ACGCGGCCCG CCAGGCGGTC GCCGACCTGG TGAACGGCGA TCCCCGCGGT 
GTGGTGCTCG GCGCCGACCG CGCGCTGCTG CTGGCCTCGC TGGCCGATGC CGCGTCGTCG 
CGGGTGGGTC TGGGCTACGA GGTGGTCGTC ACCCGACTGG ACGACGAGGC GAACATCGCG 
CCGTGGCTGC GTGCGGCCAA CCGGTACGGC GCCAAGATCA AGTGGGCCGA GGTCGACATC 
GAAACCGGTG AACTGCCCGC CTGGCAGTGG GAGGGGTTGA TCACCGGCCC GACCCGCCTG 
GTGGCGATCA CATCGGCGTC CTCGACCATC GGCACGGTCA CCGATCTGCG GGCGGTGACC 
AAACTCGTAC ACGAGGTGGG CGGTCTGGTC GTCGTCGACC ACTCCGCGGC GGCCCCGTAC 
CGGCTGATCG ACCTCGAGGA GATCGACGCG GACGTCGTGG CGCTCAACGC GGTGGCATGG 
GGCGGTCCGC CGATCGGCGC GCTGGTCTTC CGCGATCCGT CGACCATCGA ACAGTTCGGT 
TCGGTGTCGC TGGATCCGTA TGCGACCGGG CCGGCCCGCC TGGAGGTCGG GGTGCACCAG 
TTCGGCATGC TCGCCGGGGT GGTGGCCAGC ATCGAGTATC TGGCGGGTCT CGACGAGAAC 
GCCACCGGCA CCCGGCGCGA GCGGCTGTCG CTGTCGATGC AGTCCGCCAC CTCGTACATG 
AGCAGGCTCT TCGACTACCT GTTGATGTCG CTGCGCTCGC TACCGCTGGT GATGGTGATC 
GGTCAGCCCG AGGTTCGCAT CCCGACGCTG AGTTTCGCGG TCCGCGACGT CCCGGCCGAG 
AAGGTGGTGC AGCGGCTCGC CGACAACGGT GTGCTGGCCA TCGCGAACGC GAACTCCCGG 
GTCCTCGACG TCATCGGCGT CGACGACATC GGCGGAGCCG TGACGATCGG GCTTGCGCAC 
TACACCACCA CCGCCGAGGT CGACCAGCTG GTGCGCGCAC TGGCGTCGCT GGGCTGA

Protein sequence

MAYDVARVRG LHPSLGDGWV HFDAQHGMLL PDAVATTVST AFRGSMSTTV GPHPSARRSA 
AVLHAARQAV ADLVNGDPRG VVLGADRALL LASLADAASS RVGLGYEVVV TRLDDEANIA 
PWLRAANRYG AKIKWAEVDI ETGELPAWQW EGLITGPTRL VAITSASSTI GTVTDLRAVT 
KLVHEVGGLV VVDHSAAAPY RLIDLEEIDA DVVALNAVAW GGPPIGALVF RDPSTIEQFG 
SVSLDPYATG PARLEVGVHQ FGMLAGVVAS IEYLAGLDEN ATGTRRERLS LSMQSATSYM 
SRLFDYLLMS LRSLPLVMVI GQPEVRIPTL SFAVRDVPAE KVVQRLADNG VLAIANANSR 
VLDVIGVDDI GGAVTIGLAH YTTTAEVDQL VRALASLG