Gene Mmcs_5550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5550
Symbol
ID	4114418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008147
Strand	+
Start bp	121644
End bp	123587
Gene Length	1944 bp
Protein Length	647 aa
Translation table	11
GC content	69%
IMG OID	638034705
Product	hypothetical protein
Protein accession	YP_642706
Protein GI	108802510
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.429574
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTCCA CCGCGGTCAG CACCGCCCCG GTCACCTCCT GGTGGTACGG GCAAGGACGC 
GCGGTCGACG TCGTGCGGCG CCTGGAATCG CTGTACACGC TCTCCCCGCC CCCCACCGCC 
CCCGCCGGGC TGGTCACCGC CCGCCGAGAC GAACTGACCG TCACCTTCGT CGCCGGCCTG 
AAATCCCCAC TGCCGCACCC ATGGCGGCCC GCCGACTCCA GCAACGAGGC ACGGATCCCC 
TGGGAGGCCG TGGATCCGGG AAACGACCCC GACCCGGACC GGCCGGTGTA CCTGGTGGTG 
TTCGGCACCA CCGACGATGG CGGACTGATC GGACTGAATC TGGCGGCCTT TCAACGGATC 
CGCTTCGACG GTGACACCGC CACCGCCACC GCCCTGGTCA GCCGGTGGGT GCTGGAGCTG 
GTGTCCACCC ACCCCGACAT CACCATCGGT GTCACCGCCG ACGTATGGAA CGGCCCCTTC 
ACCACGCGGG TCCAGCCCGT GGCCGCGGGC CGGGTCCCGC AGGTCGACGT CCTGGTGTGC 
GGACCCGCCC TGACGTACAC CGACCGGTCG CAGATCGTGT CCAGTGCCGC CAGCAAAATT 
GTCATCGACC TGGGCAAAGA CGCCGCCGTA GATGCCCGCT GGACCATCAC CTGCGGCCCG 
GACCGGCTCG GGCAGATCAG CAGCGAACGA TCGGCCAGGC CGATGACAGC GACGCTGATC 
GTGCCCAGCG CCGCCACCGT GGACCGCTGC GCAGCGCTGC TGACCGACAC CTCAGCCCAG 
GCCGCGGCCA CTCCGCCCGA TCCCACTTAC AGCGCGGCGG CCCCCGAAGC CCCCATCACC 
GAGCTGCCGA CGGCCGACCT CGACGACCTC GACGACCCCG CCACCGACCC TCATCTGCCG 
ATCCCGTCCG ACGTCGCGAC ACTGCACGAC GACGGAATCG ACTTCTTCGC AACACAACCC 
GCCGCGGCGC CCAACGTCGG ACCCACACCG CAGCTGCAAC CCGCCCACAA CGACCCCACC 
GACGCGGACC AGGAACGCGA CTGGCCCACC GACGACCTGG ACGGGTCGAC AGCTGCGGCC 
GATGTGGGAC GCGCTGAGCT CAACCCCGCG ATCGGAGAGG GCAGCACACC GGCGGCCGAC 
GCCACCGCAG AACCTGAACC GGCAGCCGCG CCGGCAACAG CGGCCCCAAA ATCACTCCCC 
AGCGACACCG CCGACGGCGC CGCCCCCGTG GTCGCAACCA TCTGGAACAG GATCCTCGGC 
CAAGTCGCCC TCGACCCCCC GCACGCCACC CAGCAGCCGG GCCCGCGAGA GAAACGACTC 
AACGAGCTGA CGGTGTTCCT GCAACACAAC CCGTGGGTGA GCGCCACCGA CATCGTGCGC 
CACATCTACG GCGGTGTGGC CGCGGACAAG ACGGTGACCC AACAAGTTTC GCTGCTGCGC 
GCACGGCTCG GCGCCGTCTT CGCCGGCGGC CCCAAAGCGC TGCCACCCAT GACCGAGGGC 
GGCTACCACC TCGACAACGC CGTGCGCTCG GACTGGATGG AGTTCGAGCG CCTTGTCGAG 
ATCCTGCCCG AGACCACGCC CACGCCGAAC CTCGTCGCCG CCATGGATCT GGTCACCGGC 
CCACCACTGG GGGGCATCGC GCCCAAGGAA TGGACCTGGA CCAAGGATCT GCGTGACGAG 
CTGCGTGATC GCGTCGCCGG CGCCGCTGTT GTCCTGGCGC GCCGCCACCA TTCGGCGAAG 
GCCTACAGCG CTGCCGTCGA GACCGCTCGC AAGGGCCTGT GGTACGACAA CGCCCGCCAG 
GATCTGTGGC AGATCGGTAT GCAAGCGGCC CTGGATGGGC ACGACAAAGA CGCCTACAAG 
ACCCTGCGCA CCCAATACCT AGCCGCAGTT CCCGGATCTG AACGGGACCC CGAAGTATTC 
GATCTGACGA AACGAGCAGG GTAG

Protein sequence

MTSTAVSTAP VTSWWYGQGR AVDVVRRLES LYTLSPPPTA PAGLVTARRD ELTVTFVAGL 
KSPLPHPWRP ADSSNEARIP WEAVDPGNDP DPDRPVYLVV FGTTDDGGLI GLNLAAFQRI 
RFDGDTATAT ALVSRWVLEL VSTHPDITIG VTADVWNGPF TTRVQPVAAG RVPQVDVLVC 
GPALTYTDRS QIVSSAASKI VIDLGKDAAV DARWTITCGP DRLGQISSER SARPMTATLI 
VPSAATVDRC AALLTDTSAQ AAATPPDPTY SAAAPEAPIT ELPTADLDDL DDPATDPHLP 
IPSDVATLHD DGIDFFATQP AAAPNVGPTP QLQPAHNDPT DADQERDWPT DDLDGSTAAA 
DVGRAELNPA IGEGSTPAAD ATAEPEPAAA PATAAPKSLP SDTADGAAPV VATIWNRILG 
QVALDPPHAT QQPGPREKRL NELTVFLQHN PWVSATDIVR HIYGGVAADK TVTQQVSLLR 
ARLGAVFAGG PKALPPMTEG GYHLDNAVRS DWMEFERLVE ILPETTPTPN LVAAMDLVTG 
PPLGGIAPKE WTWTKDLRDE LRDRVAGAAV VLARRHHSAK AYSAAVETAR KGLWYDNARQ 
DLWQIGMQAA LDGHDKDAYK TLRTQYLAAV PGSERDPEVF DLTKRAG