Gene Mkms_3289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3289
Symbol
ID	4611215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	3446685
End bp	3448055
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	67%
IMG OID	639792962
Product	hypothetical protein
Protein accession	YP_939273
Protein GI	119869321
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.46216
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGCGCTC AGTCGTTCTG GCGTTCCTGC TGTGAGTTTG CGGAATCGGG CATCGCTGCG 
GGCTACCGCG CAGTAGTTTG CGTTTCCGTC GGCCGTCCTT TCGATGGAAA GAAGTTTGCA 
ATGCACACAG CTGCTCGTTC GTATCTGACC ACCGGTGTGG CGTTGGTGGG AGCCGGCGCC 
ATCGCGATCA GCCCCGTCGC GCCGCCGCTG TCGGACGCCG CCCGCGCCGC GACATCGAGC 
CTCACGACAT CAGATCTGCA GCTGTCCGCC CTGGCGAATC CCTTCATCGT CTACGGCGAA 
GTGGTCGAGA ACACGCTGAC GAACCTCGGT CTGCTCGGCG AGCGGGTGTT GGCCGACCCC 
GCGCCCATTC TGGCCCAGAT CCTGCAGAAC CAGTGGAACA GCGCGCAGAC GCTGGGCGGC 
GCCCTGGACC GGGCGGGCGA AAATCTCGCC AACTCGTTCT CTGCCGACAA TCCGTTCGGC 
GTGCCGGCAC TGCTTCGCGC GGCCGGCGAC CACCTGGCGG CGGGTGACCT GGAGGGTGCG 
ATCAACAGCC TGTGGCAGGT GGTGATCACG CCGCTGCTCG GCCCGGCCAT CGAACTCATC 
CCGGCGATCA CCTCGGTGAT CCGGCAGCCG GTGCAGAACA TGCTCAACGT GATCGACCAG 
ACCCAGCTGC CGATCACCTT GTTCGCGATC GGCGTGCTGA GCCCGATCTA CGCCGGTTTC 
GTGAAGGCAG GGGGCGCGTT CGTTCAAGAC GTCTTCGATG CGGCGCGCAC CGGTGACCTC 
GAAGGGCTCG CGAACGCGTT CATCACCGGA CCCGCCGCGG TGATCAACGG ATTCCTCAAC 
GGCGACGCCG TCGATGCCGG CTTCTTCAGC CCCGGTCTGG GCGCGATCAG CGGCCTGCTC 
AACATCCGCG ATGCCATTGC CCAGGCGCTC CGGCCGGTGC AGACGGCCGG AATCGCGGCG 
ATCGATTCGA CGACCACCGA CGCGACCGCC AGGACCGTAT CGGTGAGTGT GGAGTCGTCG 
GAGGAACCCG GCACATCGGA AACGGCACTC GCGCAGGAGG AGTCGACCAA GAGCGAGGGC 
GCGTCGGAGC CGGCCGATGC GACGGCCGAG ACGGACCCGC TCGACGACAC ACTTGTCGAC 
GATGTGCCAG TGGAGGAGGC GCCCGTCCAG GACGACGTGA CCGACGTGAC CGACGTGACC 
GACGTGACCG ACGTAACCGA CGATGAGGAG TCACTGACCG ACGACGAGGA GGCGTCGCCG 
GCCCAGGACG AGTCCGAGAA CACCTCCGAG GAAGCGGGCG ACGCCGGAGC CGGCGCCGAC 
GAGCCCGGTT CGGGCGACGC GCCGAGCGCG GACGCCGAGG CCACCGAGTA G

Protein sequence

MCAQSFWRSC CEFAESGIAA GYRAVVCVSV GRPFDGKKFA MHTAARSYLT TGVALVGAGA 
IAISPVAPPL SDAARAATSS LTTSDLQLSA LANPFIVYGE VVENTLTNLG LLGERVLADP 
APILAQILQN QWNSAQTLGG ALDRAGENLA NSFSADNPFG VPALLRAAGD HLAAGDLEGA 
INSLWQVVIT PLLGPAIELI PAITSVIRQP VQNMLNVIDQ TQLPITLFAI GVLSPIYAGF 
VKAGGAFVQD VFDAARTGDL EGLANAFITG PAAVINGFLN GDAVDAGFFS PGLGAISGLL 
NIRDAIAQAL RPVQTAGIAA IDSTTTDATA RTVSVSVESS EEPGTSETAL AQEESTKSEG 
ASEPADATAE TDPLDDTLVD DVPVEEAPVQ DDVTDVTDVT DVTDVTDDEE SLTDDEEASP 
AQDESENTSE EAGDAGAGAD EPGSGDAPSA DAEATE