Gene Mkms_0956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_0956
Symbol
ID	4614620
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	1042704
End bp	1043993
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	57%
IMG OID	639790633
Product	O-antigen polymerase
Protein accession	YP_936960
Protein GI	119867008
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.57168
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGTCA CGCATAATAA CTTGACGATC GCCACCAGTG CTCCACGGTT TGGTCTCGTT 
CTCGCGGCAT GGACGTGTGT CGCAGTTGTC CTGCCGGTTT ACCGAATACT CCCCGAACCG 
GCAAGAATCG CATGGTTCTG CGCAACCTTT GGCCTGATGG TGCTTTGGTT GGTGTTAGGA 
CGCGTTGCCA GACCGCTGTA CCCCGTAATT TGGATTCTTG CAGGCTATGG TGCTGTCGTC 
GCAACGGTCA CAGCCACGGG TCGAGCATCT GTGCCGGACA ACTTGTTTAC GGGCAGTCAG 
CTAGCCATCC TTCTTGGAGT TGGCCCCTTT GTACTTCGAT GGCTTGTCTT GAACATTCCC 
GATTTTACCC GAACGGTGTG CATTGCATTC CTGATTGGCC AAACGTGCTC GTCGGCGGCC 
GGTATTGCCC AGATCATGGG GACTTCGGTC TTTGGCTTTG CCACGGTACA GGGGCGCGCC 
CCCGGACTCT CAGCTCACCC GAATGTCCTC GGATTGCTTT CCTGTCTCGC GCTCTTGGTT 
TGTGTACAGG CGCTTGTTCA CGAGCGTCAG CCGCGCATCT TGATCGGTGC CGCTGGTGCG 
AGTGCCATAA ATATCGGCGG CCTCCTGTCA ACCGGCAGCC TTAGTTCTCT TATGGCCGGC 
GCGGCGGGTT TGCTCGTTAC CGCAATCTGC CTCCGCGACC AAATCAAGCA CCTCAGTAGA 
ATAATCGTGG GAACAGCAAT CGTCTCGTGG GTTGTTCTAA CTTATACTGA CTTCGCGGAC 
AATATGCGTA CGCCAGCAGA CCGATACTTA CAGGTCACGG GGCAGACCGA TGCAGAGAGC 
ACTTGGGAGA TCCGGCAACG GACGTACCAA TTTGCTTGGG ACGCAATTAG AGAGGATCCT 
CTTTTCGGCG TTGGTTTGCC GGTGAAGTTC GGAGCAACGT TCGACGGGAT CACCCTCACG 
CACAACTTTC TTCTACGATC CTGGTTTCAG GGGGGTATTG CGCTGGCTCT CCTCGGCTCC 
CTGATCGTCC TTGCTGTTCT TATTGTTGCC ATGAAAGCGC TTCGTCATAA GGACAACGGT 
CTCGCGGCCG GCGTCCTCGT GACGGTGATG GCGTTCGCGT TGACCTCCGC ATTCTTCGAG 
CAGCCCAACT ATTGGTTGCC TGCTCTGCTG GCGTGGGCGG CGCTTAGGCC GTGGAGCAAG 
CCGGAAAGCG CGCCTGAGCT TGTTACGGGA AACAATGGTG CTGCCCCGCC GGGACTGATC 
ATTGCGGGCA CTTCGACGCC TTCGCCGTGA

Protein sequence

MRVTHNNLTI ATSAPRFGLV LAAWTCVAVV LPVYRILPEP ARIAWFCATF GLMVLWLVLG 
RVARPLYPVI WILAGYGAVV ATVTATGRAS VPDNLFTGSQ LAILLGVGPF VLRWLVLNIP 
DFTRTVCIAF LIGQTCSSAA GIAQIMGTSV FGFATVQGRA PGLSAHPNVL GLLSCLALLV 
CVQALVHERQ PRILIGAAGA SAINIGGLLS TGSLSSLMAG AAGLLVTAIC LRDQIKHLSR 
IIVGTAIVSW VVLTYTDFAD NMRTPADRYL QVTGQTDAES TWEIRQRTYQ FAWDAIREDP 
LFGVGLPVKF GATFDGITLT HNFLLRSWFQ GGIALALLGS LIVLAVLIVA MKALRHKDNG 
LAAGVLVTVM AFALTSAFFE QPNYWLPALL AWAALRPWSK PESAPELVTG NNGAAPPGLI 
IAGTSTPSP