Gene Mmcs_0390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_0390
Symbol
ID	4109236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	437304
End bp	438701
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	66%
IMG OID	638029515
Product	sulfatase
Protein accession	YP_637567
Protein GI	108797370
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACAGGAC AACCACGGGT GACTCCGCAG GACCGCGCCA ACGTGCTGAT CGTCCACTGG 
CACGATCTCG GTCGCTACCT CGGCGCCTAC GGACACCCGG ACGTACAGAG CCCCCGCCTC 
GACCGGTTCG CCGCCGAAAG CATCCTGTTC ACCCGCGCCC ACGCCACCGC ACCGCTGTGC 
TCACCGTCGC GCGGGTCGCT GTTCACGGGC CGCTACCCGC AGAGCAACGG CCTGGTCGGA 
CTGGCGCACC ACGGCTGGGA GTACCGCGCC GGCGTCCGCA CCCTACCGCA CATCTTGTCT 
GAAAACGGTT GGCACACCGC ACTTTTCGGG ATGCAGCACG AGACGTCGTA TCCGCCGAAA 
CTGGGGTTCG ACGAGTTCGA CGTGTCCAAC TCCTACTGCG AATACGTGGT CGAACGCGCC 
ACCGGGTGGC TGCTCGACGC ACCGCAGCGC CCCTTCCTGC TCACCGCGGG ATTCTTCGAG 
ACCCACCGGC CCTACCCGCG TGACCGCTAC GAACCCGCCG ACGCCACCAC CGTCGCGCTA 
CCCGACTACC TTCCCGAGGA CCGGGAGGTG CGCCAGGATC TGGCCGAGTT CTACGGGTCG 
ATCACCGTCG CCGACGCGGC AGTCGGCCAA CTGCTCGACA CGCTCGCGGC CACCGGACTG 
GACCGCAGCA CCTGGGTGGT GTTCATGACC GACCACGGTC CGGCCCTGCC CCGGGCGAAG 
TCCACGCTGT ACGACGCGGG CACCGGTATC GCGATGATCA TCCGGCCGCC GCTTGACGCC 
GGCATCGCCC CCGGCGTCTA CGACGATCTG TTCAGCGGCG TCGACCTGCT ACCCACGCTG 
CTCGACGTGC TCGGCGTCGA CATTCCCGGG GAGGTCGAGG GACTCTCGCA TGCCGACAAT 
TTGCTGGGCG GCGCGGAGAA AACGCGGGAA GTGCGCACCG CGGTGTACAC CACGAAGACC 
TATCACGATT CCTTCGACCC AATTCGGGCG ATCCGGACAA AAGAATTCAG CTATATCGAG 
AATTACGCGC AACGGCCGCT GTTGGATCTG CCGTGGGACA TCGCCGAAAG CGCCCCCGGG 
CGCATCGTCG GACCGCGGGC ACGCACGCCA CGGCCCGCCC GCGAACTCTA CGACCTCCGC 
ACCGACCCCA CCGAGCAACA CAACCTGCTG ACGTCGGAGA ACAAGATCAA CGCCGAGGCC 
GTCGCGACCG ATCTGGCGCT CCTGCTCGAC GACTGGCGGG TGAAGACCAA CGACGTCATA 
CCGTCGGATT TCGCGGGTAC GCGGATATCC GACCGATACA CCGAGACATA TCTGCGAATT 
CACCGGCGGG AAGTCACCAG TCGCTCGGCC ATCGCTGCGG AACGAGGCGT CAAGGGTGAG 
CGCCGAACGG CGCAATGA

Protein sequence

MTGQPRVTPQ DRANVLIVHW HDLGRYLGAY GHPDVQSPRL DRFAAESILF TRAHATAPLC 
SPSRGSLFTG RYPQSNGLVG LAHHGWEYRA GVRTLPHILS ENGWHTALFG MQHETSYPPK 
LGFDEFDVSN SYCEYVVERA TGWLLDAPQR PFLLTAGFFE THRPYPRDRY EPADATTVAL 
PDYLPEDREV RQDLAEFYGS ITVADAAVGQ LLDTLAATGL DRSTWVVFMT DHGPALPRAK 
STLYDAGTGI AMIIRPPLDA GIAPGVYDDL FSGVDLLPTL LDVLGVDIPG EVEGLSHADN 
LLGGAEKTRE VRTAVYTTKT YHDSFDPIRA IRTKEFSYIE NYAQRPLLDL PWDIAESAPG 
RIVGPRARTP RPARELYDLR TDPTEQHNLL TSENKINAEA VATDLALLLD DWRVKTNDVI 
PSDFAGTRIS DRYTETYLRI HRREVTSRSA IAAERGVKGE RRTAQ