Gene Mkms_5094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_5094
Symbol
ID	4612777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	5336751
End bp	5338058
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	69%
IMG OID	639794791
Product	hypothetical protein
Protein accession	YP_941073
Protein GI	119871121
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0514803
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.717772
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTCGA GCGCACCGGC TTTCGTTCCC AGCGTGCCTC GCGCTGCGCG GCTCGAGGCG 
TGCTTCGAGG AACTCGCGGA GCTGACGGGC CAGCGCAACG CCATCGACGG GCGCATCGTG 
GAGATCGTGG CCGAGATCGA CGGTGACGGG CGGTGGGGCG CCACCGGTGC CCGCTCCGTC 
GCGGCGTTGG TGGCGTGGAA AACCGGTGTG TCACCGGCGA ACGCGAAAAC CATCGCCACC 
ATCGCCCACC GGCTCACCGA GTTCCCCCGC TGTACCCGAG CCCTCCGCGA GGGCCGACTG 
TCACTGGATC AAGTCGGAGC CATCGCCGAA CGGGCAGCCA CCGGATCCGA TGACCACTAC 
GCCGAACTGG CCACCCACGC CTCAGTCAGC CAACTCCGCA CCGCCATCAA ACTCGAACCC 
CCACCCCAAC CCGAACCCGA ACCCGAACCC GACGCTGTCA GCGATGCCGA CGTCGAACCG 
AAACCCCTCC CCGGTCCGGC AGACCTACAG CCCTCGATCA CCACAACCTC CGACGAGCAG 
TACACCTACT GGCACATCAA GGTGCCCCAC GTCGACGCGG CGAAAGTCGA CGCCGTCCTG 
CGCTCCCGCC TCGACGGGCT CATCGCCCAG TGGAAACGCG ACCACGGCGA CACCGATGAC 
ACCTCAGGTC CCGGCCGGCC GCCGATGCCG CGGCTGGCTG ATGCGTTCAT GGACCTCATC 
GACACCGGCT GGGACGCCGA GGCCGCCCGC CGCCCGCATG GAGACCGCAC CACCGTGGTC 
ATGCACCTCG ACATCAACGA CCGCATCGCC GCCCTCCACC TCGGCCCGCT GCTCTCGGAT 
GCCGATCGTC GCTTCCTGGG CTGTGACGCC ACCTGCGAAG TGTGGTTCGA ACGCGACGGC 
CAACCCATCG GCGCCGGACG CACCACCCGC CTGATCAACC GCCGACTGCG GCGCGCCCTC 
GAACACCGCG ACCGCACCTG CGCGGTCCCC GGCTGCGCAG CCACCCGCGG ACTGCACGCC 
CACCACATCC AGCACTGGGA AGACGGCGGA CCCACCGACC TCGACAACCT CGTCCTGGTC 
TGCCCCTACC ACCACCGCCT GCACCACCGC GGCATCATCA CCATCACCGG ACCCGCATCG 
AAGCTCACCG TCACCGACGC CACCGGCCGA AGGCTGGAGT CGGGATCCCT GGCCCGCCAA 
CCCAACCAAC CCCCACCCCA GGTGCCGCCC TACCGCGGAC CTTCCGGCGA GCGCGCCGAC 
TGGTGGTGGT ACACACCATT CCAACCCCCA CCGCCCACTA CCAACTGA

Protein sequence

MPSSAPAFVP SVPRAARLEA CFEELAELTG QRNAIDGRIV EIVAEIDGDG RWGATGARSV 
AALVAWKTGV SPANAKTIAT IAHRLTEFPR CTRALREGRL SLDQVGAIAE RAATGSDDHY 
AELATHASVS QLRTAIKLEP PPQPEPEPEP DAVSDADVEP KPLPGPADLQ PSITTTSDEQ 
YTYWHIKVPH VDAAKVDAVL RSRLDGLIAQ WKRDHGDTDD TSGPGRPPMP RLADAFMDLI 
DTGWDAEAAR RPHGDRTTVV MHLDINDRIA ALHLGPLLSD ADRRFLGCDA TCEVWFERDG 
QPIGAGRTTR LINRRLRRAL EHRDRTCAVP GCAATRGLHA HHIQHWEDGG PTDLDNLVLV 
CPYHHRLHHR GIITITGPAS KLTVTDATGR RLESGSLARQ PNQPPPQVPP YRGPSGERAD 
WWWYTPFQPP PPTTN