Gene Mkms_5531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_5531
Symbol
ID	4610271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008703
Strand	+
Start bp	37627
End bp	38865
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	71%
IMG OID	639789196
Product	hypothetical protein
Protein accession	YP_935531
Protein GI	119854926
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.219128
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00000520747
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCGGGGGT TACGGCGTGA AGGGGTGGGG GCTGTCGTGG TGCAGGCAGG CGAGGAGCTC 
GGCGGTGCCG GTGTGGTCGG GGCTGCCGTC GACGGCGTCG CCGGTCTGGA TGATGGCGGC 
GATGTCGGCT CCGAGGTGCA GTGTGTAGCG CGGCCATTCG TCATCGCCGG CGCGGGCGAT 
CAGGGCCGCG GTGGCGGCCG TGAGCCGGAT GCGTGCGTGG GCGGGGTTGT TGCCGAGACC 
GATGATGGTC TGCTTGCTGC GGTGGCCGCT GCTGGTCACT GCCCAGGTGA TGGTCATGTT 
CCGATGATCG CCGCCAGGGG GCGGTGCCGG GAGGGGCCGC ACTCCCGGTT GTGGATTAAG 
TGCGGCCCCT GTGGATCACC GGGTCGGGCG GTAGCTGGCG TCGGTGGGGT CGAAGCGGTG 
TTGGTCTCCG TCGAGGCAGA CAGCGGCGGC TGTTTTGTGG GCGAGTTGGA GGACTTCGAC 
AGCGCTGCGG TAGGCGGCGA GGTCGACGAT CTGGAATGTC ACGGGCCGCA TGTAGACCTC 
GACCCAGCGG ATGGTGCGTC GCTTGTCGGG GGTGAGGGCT TCGCGGCGGG TGACGGCGTA 
GGGCGGGCGT CGGGTCCAGT CGACGCCGAT GGCGGGCCCG TCGTAGGGCT GTTGGTCGCG 
CGGGGCGAGG TTGTCGGGGA GCCCGGCCAG CGCCTGGCGG GCGGCTCCGA AGGCTTCCAG 
CACGCCCTGG GCTGCTTGGG TGTTGAAGAA GGTGAACAGG ATGCGTCCCC AGGTGAGGGT 
GACGCGGGCG ATGTCGGTGT GGGCGTGATG GACGCTGATG TCGGGCTGTT GGGCGCCGCG 
CAGTCGTACG TAGGCCTGGG AGATCGCTCC GGCGGGGATG CCGATGTGCG ACTCGGGGAT 
GGCGATCTTG GTCATGGTTG TTCTCCGTTC GTGTACGGGT TGGGTGCGCC GGTTAGCGCT 
GGGGTTGCGG GGGACCGGCG GGGTGGCGCG CGCAACCTCG AAGAGGCCGT GACGGGCGGA 
GCAGGGTTTT CGGCCCGCGC GAGCCGGCGC GCAGCGCCCT GGCGAGCTGG CGTTGGGCCG 
AAAAGGTCAC TCGGCCTGCG CAGTTCGGCG CGGACGTGGG TTGCGCGTGA CGGGGCCTCG 
TCGGTCACAC TGGGCGACCC AGCTGAACGG TTAAAGGTGA GCAGCTGCCC AACCCACGCC 
CGCCGCAGGC GGGCATCGGC GCCTCCGGGC GCCGCTTGA

Protein sequence

MRGLRREGVG AVVVQAGEEL GGAGVVGAAV DGVAGLDDGG DVGSEVQCVA RPFVIAGAGD 
QGRGGGREPD ACVGGVVAET DDGLLAAVAA AGHCPGDGHV PMIAARGRCR EGPHSRLWIK 
CGPCGSPGRA VAGVGGVEAV LVSVEADSGG CFVGELEDFD SAAVGGEVDD LECHGPHVDL 
DPADGASLVG GEGFAAGDGV GRASGPVDAD GGPVVGLLVA RGEVVGEPGQ RLAGGSEGFQ 
HALGCLGVEE GEQDASPGEG DAGDVGVGVM DADVGLLGAA QSYVGLGDRS GGDADVRLGD 
GDLGHGCSPF VYGLGAPVSA GVAGDRRGGA RNLEEAVTGG AGFSARASRR AAPWRAGVGP 
KRSLGLRSSA RTWVARDGAS SVTLGDPAER LKVSSCPTHA RRRRASAPPG AA