Gene Mmcs_0344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_0344
Symbol
ID	4109190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	379844
End bp	381124
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	68%
IMG OID	638029469
Product	hypothetical protein
Protein accession	YP_637521
Protein GI	108797324
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.053887
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGTG ACTGGGTCGT CGGCGACCAT CTCGGCCTGC CGATCCCCGC CACCGCCGCT 
GCACTGCGTG ACGGCGGAGA GACGTTTCTG ACCAACGCGT TTCGCGCATT CGGTGCACTC 
ACCGAGGACA ACCGGGTGGT ACGGATCGGC CGGTGCGACG AGATGACCGG CGGCAGCACA 
GGCCGCAAGA TGCTGCTCGA CGTCGAGTAC GCCCGCCCCG AACCGGGTCT GCGCACGGAC 
CTGTTCGTCA AGTTCTCCCG CGACTTCGAC GACCCCGTCC GGGACCGCGG GAGAACCCAG 
ATGGCTTCGG AGGTGGTGTT CGCGGCGCTG TCGCGGACGC CCGGGTTCCC GATCGCGATC 
CCCCATCCCC GGTTCGGGGA CTACCACGCC GGCACCGGCA CGGGAATCCT GATCACCGAT 
CGGATCCCGT TCGGGTGCAA CGGTGTCGAG CGCCAGTACG AGAAGTGCCT GGACGAGGAC 
ATGCCGCATC CCGACGAGCA CTACCGCGCG CTGGTCACCG CGCTGGCGCG GCTGGCGGGC 
GCGCAGCGGT CCGGTCGGCT GCCTGAGCAG CTCTCGGCGG CGTTCCCCGT CGACCTGCGG 
GCGGCGACCG TCGGGGAACC GGTGACGTTG TCACCAGATC GATTGCAGCG CCGGTTGTCC 
CGTCTCGGAG AATTCACCGA GACCCACCCG GGACTGCTGC CACCGCATGT GCGGACCTCC 
GGCTTCCTGG CGCGCCTCGG CGAGGAGGCC CATGAGGTGT TACGCCGCGA GCAGGCGATC 
TGGCGATCGC TGCGGGACGC CGACGACCAC ATCGCGCTGA GCCACTGGAA CGCCAACGTC 
GACAACGCGT GGTTCTGGCG CGACGGCGGC GGCGTGCTGC AGTGCGGGCT GATGGACTGG 
GGCTGCGTCA GCCGACTGAA CCTCGCGATG GCGCTGTGGG GCGCGTTGTG CGCCGCCGAA 
ACCGACCTGT GGGACAACCA CTTCGACGAG CTGCTCGTGC TGTTCTGCAC CGAGGTGGAA 
GGCGCAGGAG GACCACGACC CGATCCGGTG CTGATGCGGC GGCACCTGAT GCTCTACATG 
GCGCTGATGG GCATCACCTG GCTGCTCGAC GTGCCTGCGC GCATCGGCAA CCGCCTGCCC 
GACGCCGACG TCCACACCAC GAGACACGAT CCACGCATCC GTGGGGACGA GAGCCTGCGC 
GCTCCGCTGC AGATGTTCAC CAACATGTTG AACCTCTGGC AGACAAGGGG TTTGAGCGGC 
CACCTGGAGG GGCTCGACTA G

Protein sequence

MSGDWVVGDH LGLPIPATAA ALRDGGETFL TNAFRAFGAL TEDNRVVRIG RCDEMTGGST 
GRKMLLDVEY ARPEPGLRTD LFVKFSRDFD DPVRDRGRTQ MASEVVFAAL SRTPGFPIAI 
PHPRFGDYHA GTGTGILITD RIPFGCNGVE RQYEKCLDED MPHPDEHYRA LVTALARLAG 
AQRSGRLPEQ LSAAFPVDLR AATVGEPVTL SPDRLQRRLS RLGEFTETHP GLLPPHVRTS 
GFLARLGEEA HEVLRREQAI WRSLRDADDH IALSHWNANV DNAWFWRDGG GVLQCGLMDW 
GCVSRLNLAM ALWGALCAAE TDLWDNHFDE LLVLFCTEVE GAGGPRPDPV LMRRHLMLYM 
ALMGITWLLD VPARIGNRLP DADVHTTRHD PRIRGDESLR APLQMFTNML NLWQTRGLSG 
HLEGLD