Gene Mmcs_0939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_0939
Symbol
ID	4109779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	1036970
End bp	1038259
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	57%
IMG OID	638030063
Product	O-antigen polymerase
Protein accession	YP_638110
Protein GI	108797913
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.51136
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGTCA CGCATAATAA CTTGACGATC GCCACCAGTG CTCCACGGTT TGGTCTCGTT 
CTCGCGGCAT GGACGTGTGT CGCAGTTGTC CTGCCGGTTT ACCGAATACT CCCCGAACCG 
GCAAGAATCG CATGGTTCTG CGCAACCTTT GGCCTGATGG TGCTTTGGTT GGTGTTAGGA 
CGCGTTGCCA GACCGCTGTA CCCCGTAATT TGGATTCTTG CAGGCTATGG TGCTGTCGTC 
GCAACGGTCA CAGCCACGGG TCGAGCATCT GTGCCGGACA ACTTGTTTAC GGGCAGTCAG 
CTAGCCATCC TTCTTGGAGT TGGCCCCTTT GTACTTCGAT GGCTTGTCTT GAACATTCCC 
GATTTTACCC GAACGGTGTG CATTGCATTC CTGATTGGCC AAACGTGCTC GTCGGCGGCC 
GGTATTGCCC AGATCATGGG GACTTCGGTC TTTGGCTTTG CCACGGTACA GGGGCGCGCC 
CCCGGACTCT CAGCTCACCC GAATGTCCTC GGATTGCTTT CCTGTCTCGC GCTCTTGGTT 
TGTGTACAGG CGCTTGTTCA CGAGCGTCAG CCGCGCATCT TGATCGGTGC CGCTGGTGCG 
AGTGCCATAA ATATCGGCGG CCTCCTGTCA ACCGGCAGCC TTAGTTCTCT TATGGCCGGC 
GCGGCGGGTT TGCTCGTTAC CGCAATCTGC CTCCGCGACC AAATCAAGCA CCTCAGTAGA 
ATAATCGTGG GAACAGCAAT CGTCTCGTGG GTTGTTCTAA CTTATACTGA CTTCGCGGAC 
AATATGCGTA CGCCAGCAGA CCGATACTTA CAGGTCACGG GGCAGACCGA TGCAGAGAGC 
ACTTGGGAGA TCCGGCAACG GACGTACCAA TTTGCTTGGG ACGCAATTAG AGAGGATCCT 
CTTTTCGGCG TTGGTTTGCC GGTGAAGTTC GGAGCAACGT TCGACGGGAT CACCCTCACG 
CACAACTTTC TTCTACGATC CTGGTTTCAG GGGGGTATTG CGCTGGCTCT CCTCGGCTCC 
CTGATCGTCC TTGCTGTTCT TATTGTTGCC ATGAAAGCGC TTCGTCATAA GGACAACGGT 
CTCGCGGCCG GCGTCCTCGT GACGGTGATG GCGTTCGCGT TGACCTCCGC ATTCTTCGAG 
CAGCCCAACT ATTGGTTGCC TGCTCTGCTG GCGTGGGCGG CGCTTAGGCC GTGGAGCAAG 
CCGGAAAGCG CGCCTGAGCT TGTTACGGGA AACAATGGTG CTGCCCCGCC GGGACTGATC 
ATTGCGGGCA CTTCGACGCC TTCGCCGTGA

Protein sequence

MRVTHNNLTI ATSAPRFGLV LAAWTCVAVV LPVYRILPEP ARIAWFCATF GLMVLWLVLG 
RVARPLYPVI WILAGYGAVV ATVTATGRAS VPDNLFTGSQ LAILLGVGPF VLRWLVLNIP 
DFTRTVCIAF LIGQTCSSAA GIAQIMGTSV FGFATVQGRA PGLSAHPNVL GLLSCLALLV 
CVQALVHERQ PRILIGAAGA SAINIGGLLS TGSLSSLMAG AAGLLVTAIC LRDQIKHLSR 
IIVGTAIVSW VVLTYTDFAD NMRTPADRYL QVTGQTDAES TWEIRQRTYQ FAWDAIREDP 
LFGVGLPVKF GATFDGITLT HNFLLRSWFQ GGIALALLGS LIVLAVLIVA MKALRHKDNG 
LAAGVLVTVM AFALTSAFFE QPNYWLPALL AWAALRPWSK PESAPELVTG NNGAAPPGLI 
IAGTSTPSP