Gene Mjls_3644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_3644
Symbol
ID	4879355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	3852116
End bp	3853687
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	69%
IMG OID	640140951
Product	protein of unknown function DUF853, NPT hydrolase putative
Protein accession	YP_001071912
Protein GI	126436221
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.852861
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.874146
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGTG AGTCGACTGA CGGCCGCGCC GCCGGGATCG CCGCGGGCTA CGCCACCGAA 
GGCCAGGCGC TGGAGTTGGG CACCGTCGTC GTCGACGGCG TGGCCGATCC GGCCGCCCGG 
GTGCGGATCC CGCTGGCGAC CGTGAACCGT CACGGCCTGG TCGCCGGCGC GACCGGCACC 
GGCAAGACGA AGTCGCTGCA GGTGCTCGCC GAACAGTTGT CGGCCGCGGG CGTGCCGGTG 
CTGATGGCCG ATGTGAAAGG CGATCTGTCC GGGCTGGCCC GGCCCGGTGA ACCCGGTGAG 
AAGGTCTCCG AACGGGCCGC CGACACCGGC GACGCCTGGA CTCCGACGGC GTACCCGGTC 
GAGTTCCTGA CCCTTGGAAC CGGCGGTGTC GGGGTGCCGG TGCGCGCCAC GGTGTCCAGC 
TTCGGCCCGA TCCTGCTGTC GAAGGTGTTG GGGCTCAATC AGACTCAGGA GTCGACGCTC 
GGTTTGATCT TCCACTGGGC CGACCAGAAG GGGTTGCCGC TGCTCGATCT GAAGGATCTG 
CGGTCGGTGA TCCACTTCCT CACCAGCGAA GAGGGGAAAC CCGAACTCAA GGCGCTCGGG 
GCTGTGTCCT CGACGACGGC CGGGGTGATT TTGCGCACGC TGATCAACCT CGAGGCCGAG 
GGGGCGGACA CCTTCTTCGG TGAACCCGAG TTCGAACCCG ACGATCTGCT GCGCCTCCAC 
GCTGACGGCC GCGGCGTCGT CACATTGCTC GAACTGGGCA GCCAGGCCGC CCGCCCGGTG 
CTGTTCTCCA CCTTCCTCAT GTGGGTGCTG GCCGATCTGT TCACGACGCT GCCGGAGGTC 
GGTGACCTCG ACAAGCCGAA GCTCGTGTTC TTCTTCGACG AGGCGCACCT GCTGTTCGCG 
GACGCGTCGA AGGCGTTCCT CGAACAGGTC GAACAGACCG TCAAGCTGAT CCGGTCCAAG 
GGCGTCGGCG TGTTCTTCTG CACGCAACTG CCGACCGACG TACCCAACGG CGTGCTGTCA 
CAACTCGGCG CGCGGGTGCA GCACGCGTTG CGCGCGTTCA CCCCGGACGA CGAGAAGGCG 
CTGCGCAAGA CCGTCCGCAC CTACCCGAAA ACCGATGTCT ACGACCTGCA GTCGGCGCTG 
TCGACGCTGG GTATCGGCGA GGCGATCGTC ACGGTGCTCT CCGAGCAGGG CGTCCCGACG 
CCGGTGGCGT GGACGCGGAT GCGGGCCCCG CGGTCGCTGA TGGACACCAT CGGCGCCGAG 
GCGATCACGG CCGCCGCCAC GGCCAGCCCG CTGCAGGCCG AGTACGGCCA GACCGTCGAC 
CGTGAATCCG CCTACGAGCG GCTGGCCGCC CGGTTGGCGC CGCCGCCGGC CGCGCCGCCC 
GCGGACCTGC CGCCGGTTCC GCCGCCGTAC GATATTCCGC CCATGCCCGC GCCCGCGCCG 
GAGCCGGGTC TGTTCGACAA GGTGATGGAC AGCCCGGCCT TCAAGAGCGC GATGCGGTCA 
GCGGGCACCG TCATCGGCCG CGAGATCACC CGCAGCATCT TCGGCACCGG TCGCCGGCGC 
CGCCGTCGTT AG

Protein sequence

MTSESTDGRA AGIAAGYATE GQALELGTVV VDGVADPAAR VRIPLATVNR HGLVAGATGT 
GKTKSLQVLA EQLSAAGVPV LMADVKGDLS GLARPGEPGE KVSERAADTG DAWTPTAYPV 
EFLTLGTGGV GVPVRATVSS FGPILLSKVL GLNQTQESTL GLIFHWADQK GLPLLDLKDL 
RSVIHFLTSE EGKPELKALG AVSSTTAGVI LRTLINLEAE GADTFFGEPE FEPDDLLRLH 
ADGRGVVTLL ELGSQAARPV LFSTFLMWVL ADLFTTLPEV GDLDKPKLVF FFDEAHLLFA 
DASKAFLEQV EQTVKLIRSK GVGVFFCTQL PTDVPNGVLS QLGARVQHAL RAFTPDDEKA 
LRKTVRTYPK TDVYDLQSAL STLGIGEAIV TVLSEQGVPT PVAWTRMRAP RSLMDTIGAE 
AITAAATASP LQAEYGQTVD RESAYERLAA RLAPPPAAPP ADLPPVPPPY DIPPMPAPAP 
EPGLFDKVMD SPAFKSAMRS AGTVIGREIT RSIFGTGRRR RRR