Gene Mmcs_3639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_3639
Symbol
ID	4112471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	3884504
End bp	3886072
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	69%
IMG OID	638032777
Product	protein of unknown function DUF853, NPT hydrolase putative
Protein accession	YP_640802
Protein GI	108800605
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0432207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAGTG AGTCGACTGA CGGCCGCGCC GCCGGGATCG CCGCGGGCTA CGCCACCGAA 
GGCCAGGCGC TGGAGTTGGG CACCGTCGTC GTCGACGGCG TGGCCGATCC GGCCGCCCGG 
GTGCGGATCC CGCTGGCGAC CGTGAACCGT CACGGCCTGG TCGCCGGCGC GACCGGCACC 
GGCAAGACGA AGTCGCTGCA GGTGCTCGCC GAACAGTTGT CGGCCGCGGG CGTGCCGGTG 
CTGATGGCCG ATGTGAAAGG CGATCTGTCC GGGCTGGCCC GGCCCGGTGA ACCCGGTGAG 
AAGGTCTCCG AACGGGCCGC CGACACCGGC GACGCCTGGA CTCCGACGGC GTACCCGGTC 
GAGTTCCTGA CCCTTGGAAC CGGCGGTGTC GGGGTGCCGG TGCGCGCCAC GGTGTCCAGC 
TTCGGCCCGA TCCTGCTGTC GAAGGTGTTG GGGCTCAATC AGACTCAGGA GTCGACGCTC 
GGTTTGATCT TCCACTGGGC CGACCAGAAG GGGTTGCCGC TGCTCGATCT GAAGGATCTG 
CGGTCGGTGA TCCACTTCCT CACCAGCGAA GAGGGGAAAC CCGAACTCAA GGCGCTCGGG 
GCTGTGTCCT CGACGACGGC CGGGGTGATT TTGCGCACGC TGATCAACCT CGAGGCCGAG 
GGGGCGGACA CCTTCTTCGG CGAACCCGAG TTCGAACCCG ACGATCTGCT GCGCCTCCAC 
GCTGACGGCC GCGGCGTCGC CACGTTGCTC GAACTGGGCA GCCAGGCCGC CCGCCCGGTG 
CTGTTCTCCA CCTTCCTCAT GTGGGTGCTG GCCGATCTGT TCACGACGCT GCCGGAGGTC 
GGTGACCTCG ACAAGCCGAA GCTCGTGTTC TTCTTCGACG AGGCGCACCT GCTGTTCGCG 
GACGCGTCGA AGGCGTTCCT CGAACAGGTC GAACAGACCG TCAAGCTGAT CCGGTCCAAG 
GGTGTCGGCG TGTTCTTCTG CACGCAACTG CCGACCGACG TACCCAACGG CGTGCTGTCA 
CAACTCGGCG CGCGGGTGCA GCACGCGTTG CGCGCGTTCA CCCCGGACGA CGAGAAGGCG 
CTGCGCAAGA CCGTCCGCAC CTACCCGAAA ACCGACGTCT ACGACCTGCA GTCGGCGCTG 
TCGACGCTGG GTATCGGCGA GGCGATCGTC ACGGTGCTCT CCGAGCAGGG CGTCCCGACG 
CCGGTGGCGT GGACGCGGAT GCGGGCCCCG CGCTCTCTGA TGGACACCAT CGGCGCCGAG 
GCGATCACGG CCGCCGCCAC GGCCAGCCCG CTGCAGGCCG AGTACGGCCA GACCGTCGAC 
CGTGAATCCG CCTATGAGCG GCTGGCCGCC CGGTTGGCGC CGCCGCCGGT CGCGCCGCCC 
GCGGACCTGC CGCCGGTTCC GCCGCCGTAC GATATTCCGC CCATGCCCGC GCCCGCGCCG 
GAGCCGGGTC TGTTCGACAA GGTGATGGAC AGCCCGGCCT TCAAGAGCGC GATGCGGTCA 
GCGGGCACCG TCATCGGCCG CGAGATCACC CGCAGCATCT TCGGCACCGG GCGCCGGCGC 
CGCCGTTAG

Protein sequence

MTSESTDGRA AGIAAGYATE GQALELGTVV VDGVADPAAR VRIPLATVNR HGLVAGATGT 
GKTKSLQVLA EQLSAAGVPV LMADVKGDLS GLARPGEPGE KVSERAADTG DAWTPTAYPV 
EFLTLGTGGV GVPVRATVSS FGPILLSKVL GLNQTQESTL GLIFHWADQK GLPLLDLKDL 
RSVIHFLTSE EGKPELKALG AVSSTTAGVI LRTLINLEAE GADTFFGEPE FEPDDLLRLH 
ADGRGVATLL ELGSQAARPV LFSTFLMWVL ADLFTTLPEV GDLDKPKLVF FFDEAHLLFA 
DASKAFLEQV EQTVKLIRSK GVGVFFCTQL PTDVPNGVLS QLGARVQHAL RAFTPDDEKA 
LRKTVRTYPK TDVYDLQSAL STLGIGEAIV TVLSEQGVPT PVAWTRMRAP RSLMDTIGAE 
AITAAATASP LQAEYGQTVD RESAYERLAA RLAPPPVAPP ADLPPVPPPY DIPPMPAPAP 
EPGLFDKVMD SPAFKSAMRS AGTVIGREIT RSIFGTGRRR RR