Gene Mmcs_5006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5006
Symbol
ID	4113835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	5299129
End bp	5300436
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	69%
IMG OID	638034164
Product	hypothetical protein
Protein accession	YP_642166
Protein GI	108801969
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0237713
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTCGA GCGCACCGGC TTTCGTTCCC AGCGTGCCTC GCGCTGCGCG GCTCGAGGCG 
TGCTTCGAGG AACTCGCGGA GCTGACGGGC CAGCGCAACG CCATCGACGG GCGCATCGTG 
GAGATCGTGG CCGAGATCGA CGGTGACGGG CGGTGGGGCG CCACCGGTGC CCGCTCCGTC 
GCGGCGTTGG TGGCGTGGAA AACCGGTGTG TCACCGGCGA ACGCGAAAAC CATCGCCACC 
ATCGCCCACC GGCTCACCGA GTTCCCCCGC TGTACCCGAG CCCTCCGCGA GGGCCGACTG 
TCACTGGATC AAGTCGGAGC CATCGCCGAA CGGGCAGCCA CCGGATCCGA TGACCACTAC 
GCCGAACTGG CCACCCACGC CTCAGTCAGC CAACTCCGCA CCGCCATCAA ACTCGAACCC 
CCACCCCAAC CCGAACCCGA ACCCGAACCC GACGCTGTCA GCGATGCCGA CGTCGAACCG 
AAACCCCTCC CCGGTCCGGC AGACCTACAG CCCTCGATCA CCACAACCTC CGACGAGCAG 
TACACCTACT GGCACATCAA GGTGCCCCAC GTCGACGCGG CGAAAGTCGA CGCCGTCCTG 
CGCTCCCGCC TCGACGGGCT CATCGCCCAG TGGAAACGCG ACCACGGCGA CACCGATGAC 
ACCTCAGGTC CCGGCCGGCC GCCGATGCCG CGGCTGGCTG ATGCGTTCAT GGACCTCATC 
GACACCGGCT GGGACGCCGA GGCCGCCCGC CGCCCGCATG GAGACCGCAC CACCGTGGTC 
ATGCACCTCG ACATCAACGA CCGCATCGCC GCCCTCCACC TCGGCCCGCT GCTCTCGGAT 
GCCGATCGTC GCTTCCTGGG CTGTGACGCC ACCTGCGAAG TGTGGTTCGA ACGCGACGGC 
CAACCCATCG GCGCCGGACG CACCACCCGC CTGATCAACC GCCGACTGCG GCGCGCCCTC 
GAACACCGCG ACCGCACCTG CGCGGTCCCC GGCTGCGCAG CCACCCGCGG ACTGCACGCC 
CACCACATCC AGCACTGGGA AGACGGCGGA CCCACCGACC TCGACAACCT CGTCCTGGTC 
TGCCCCTACC ACCACCGCCT GCACCACCGC GGCATCATCA CCATCACCGG ACCCGCATCG 
AAGCTCACCG TCACCGACGC CACCGGCCGA AGGCTGGAGT CGGGATCCCT GGCCCGCCAA 
CCCAACCAAC CCCCACCCCA GGTGCCGCCC TACCGCGGAC CTTCCGGCGA GCGCGCCGAC 
TGGTGGTGGT ACACACCATT CCAACCCCCA CCGCCCACTA CCAACTGA

Protein sequence

MPSSAPAFVP SVPRAARLEA CFEELAELTG QRNAIDGRIV EIVAEIDGDG RWGATGARSV 
AALVAWKTGV SPANAKTIAT IAHRLTEFPR CTRALREGRL SLDQVGAIAE RAATGSDDHY 
AELATHASVS QLRTAIKLEP PPQPEPEPEP DAVSDADVEP KPLPGPADLQ PSITTTSDEQ 
YTYWHIKVPH VDAAKVDAVL RSRLDGLIAQ WKRDHGDTDD TSGPGRPPMP RLADAFMDLI 
DTGWDAEAAR RPHGDRTTVV MHLDINDRIA ALHLGPLLSD ADRRFLGCDA TCEVWFERDG 
QPIGAGRTTR LINRRLRRAL EHRDRTCAVP GCAATRGLHA HHIQHWEDGG PTDLDNLVLV 
CPYHHRLHHR GIITITGPAS KLTVTDATGR RLESGSLARQ PNQPPPQVPP YRGPSGERAD 
WWWYTPFQPP PPTTN