Gene Mmcs_2106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_2106
Symbol
ID	4110939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	2255515
End bp	2256855
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	70%
IMG OID	638031227
Product	hypothetical protein
Protein accession	YP_639270
Protein GI	108799073
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.426457
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGGAT TGCCTGGCGC GGTCGACCGC CTACTGGCCG CGGTCGCTGA GCTGCAGACC 
GCCTCCATCG ACGAGCTCTC CTACGAGCAG ATCGTGGCCG AACTGGACCG CATCAAAGCA 
GCGGTGTGGG CGGTGCCCAG TGTGGAGCAC CGCCTGACCG CGCGGCTGAT GGACGCCGAC 
CCCCATGAAC TCGGCGCCAC CTCTATCAAG GAGGTGCTGG CCAACCACCT ACGCATCTCC 
CGCAAAGCCG CCGGCGAGCG GCTCACCGAC GCGCGCCAGT TGGGGCCGCG CTACACCCTG 
ACCGGGGAGC GGGTGCAGAC CGAGTTGGCC CACACCGCCG CCGCGGTCGC CCGCGGCGAC 
ATCGGCACCG CCCATGTGCG CATCATCCAG GACTTCGTCA GGAAACTTCC GGCATGGGTG 
TCCTGGGAGC GCCGCGACCA CTACGAACGC GACCTGGTCG GCCACGCCAG CGCACTGCGG 
CCCGAGGACC TCCGCAAGGT CGCCGACACC CTGCTGGGGT TCATCGATCA GGACGGCACC 
GAACCCGACC ACCACACCCA GCAACGCCGC CGCGAGTTCA CCGTCGGCCG CCAGCAGGCC 
GACGGGATGA GCCGGGTCTC GGGCTGGCTC ACCCCCGAAG CCCGCGCGCA CTGGGATGTC 
ATCGCCGCCA AGTACGCCGC CCCTGGCACC AATCTGCCCC ACGACGACGC CCACACCGGC 
CGCGACGACC GCACTACCGG CCAACGCCAC CACGACGCCC TCACCCGAGC AATGCGGGAC 
CATGTGCAGT CGGGCGCCCT CGGCCAGGTC GCCGGCGTTC CCGCCAGCAT CGTCGCGACG 
ATGACGCTCA GCGAGCTTGA ACGTGCCGCC GGGTGGGCGC ACACCGGCGG CGGCAACAAG 
ATCCCCATCC GCGATCTGAT CCGCATGGCC GCCCACTCCC GGCACTACCT GGCGGTGTTC 
GACGACCACA CCGAAGAAAT CCTGTATTTC GGCCGCGCCC GCCGCACGGC GTCGACCGCG 
CAACGCCTGG CCCTGTTCGC CCGCGACAGG GGCTGCACCC ACCCGGGCTG CACCGTGCCG 
TTCTATTGGA CCGAAGCCCA CCACACCCAC GACTACTCCC GCGGTGGGCG CACCGACATC 
GACGACCTCA CCCTGGCCTG CCAACCCGCC AACCTGCTCA TCGAGAAAAC CGGCTGGACC 
ACCCACCGGC CCGGCAACGG CCGCACCCAA TGGACCCCAC CCGCCGACCA CGACACCGGC 
CAACCCCGCA TCAACAACCA CTTCCACCCC CACCGCTACC TCACCGACAA CGACGACGGT 
CAAGACGACG AACCCGAATA A

Protein sequence

MDGLPGAVDR LLAAVAELQT ASIDELSYEQ IVAELDRIKA AVWAVPSVEH RLTARLMDAD 
PHELGATSIK EVLANHLRIS RKAAGERLTD ARQLGPRYTL TGERVQTELA HTAAAVARGD 
IGTAHVRIIQ DFVRKLPAWV SWERRDHYER DLVGHASALR PEDLRKVADT LLGFIDQDGT 
EPDHHTQQRR REFTVGRQQA DGMSRVSGWL TPEARAHWDV IAAKYAAPGT NLPHDDAHTG 
RDDRTTGQRH HDALTRAMRD HVQSGALGQV AGVPASIVAT MTLSELERAA GWAHTGGGNK 
IPIRDLIRMA AHSRHYLAVF DDHTEEILYF GRARRTASTA QRLALFARDR GCTHPGCTVP 
FYWTEAHHTH DYSRGGRTDI DDLTLACQPA NLLIEKTGWT THRPGNGRTQ WTPPADHDTG 
QPRINNHFHP HRYLTDNDDG QDDEPE