Gene Mmcs_0036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_0036
Symbol
ID	4108924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	45967
End bp	46995
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	64%
IMG OID	638029162
Product	hypothetical protein
Protein accession	YP_637214
Protein GI	108797017
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGAGT TCCCGCAGGA CTACGAAATC TTCGACCTCG GCGACGTGAC GCTGCAGCAC 
GGCGCCACGC TGCGCGACGC CAAGCTCGCG TACAAGACCT ATGGCGAGCT GAATGCCGAC 
AAGACCAACG CCATCGTCTA TCCGACCTGG TACTCCGGAC GCCATTGGGA CAACGAGTGG 
CTGATCGGCG AGGGTATGGC GCTAGACCCG ACCAAGTACT TCATCATCGT CCCGAACATG 
CTCGGCAACG GGCTCTCGTC GTCACCGTCG AACACACCGC CGCCGTACGA CGCCGCACGA 
TTCCCGCACG TGACCTTCTA CGACCAGGTC GAGCAGCAGC ACAAGCTCGT CACGTCGTTC 
GGGATCGAGA CCCTTCCACT CGTCACGGGC TGGTCCATGG GTGCCGGGCA GACCTACCAG 
TGGGCCGTCA GTTATCCGGA CATGGTGCAG CGCGCGCTGC CGTTCTGCGG CTCGTCGAAG 
ACCAGTGAAC ACAACATCGT GTTCCTCGAA GGCGTCAAGT CGGCGCTCAC CGCCGACGCC 
GCTTTCAAGG AGGGCTGGTA CACCGAGAAG CCGACCAAGG GGCTGCGTGC GGCCGCCCGC 
GTCTACGCCG GGTGGGGTTT CTCGCAGGCG TTCTACTGGC AGCAGGAGTA CAAGAAGATG 
GGCTATTCCT CACTCGAGGA CTTCCTCGTG GGCTTCTGGG AGGGCTTCTT CCTCGACCGC 
CGCGATCCGA ACAATCTGTT GGCGATGCTG TGGACCTGGC AGAACGGCAA CGTCGGCGCC 
ACCCCCGGCC GGGGGTTCGA CGGCGACCAG GTCGCGGCGC TCAAGACCAT CAAGGCGAAG 
ATGATCGTGG CGCCGGCCGA GAAGGACCTG TACTTCCCGC CGGAGGACGA GGAGTTCGCC 
GTCAGCCACA TCCCCAACGC CGAATTGCGC GTCATCCCAG GCATTTACGG GCATTTCGCC 
GGTGGGGACG CGAACCCCGC CGACAACCAG TTCATCGACG CCGCCCTCAA GGATCTGCTG 
GCGCGCTGA

Protein sequence

MDEFPQDYEI FDLGDVTLQH GATLRDAKLA YKTYGELNAD KTNAIVYPTW YSGRHWDNEW 
LIGEGMALDP TKYFIIVPNM LGNGLSSSPS NTPPPYDAAR FPHVTFYDQV EQQHKLVTSF 
GIETLPLVTG WSMGAGQTYQ WAVSYPDMVQ RALPFCGSSK TSEHNIVFLE GVKSALTADA 
AFKEGWYTEK PTKGLRAAAR VYAGWGFSQA FYWQQEYKKM GYSSLEDFLV GFWEGFFLDR 
RDPNNLLAML WTWQNGNVGA TPGRGFDGDQ VAALKTIKAK MIVAPAEKDL YFPPEDEEFA 
VSHIPNAELR VIPGIYGHFA GGDANPADNQ FIDAALKDLL AR