Gene Mjls_4333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_4333
Symbol
ID	4880038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	4571179
End bp	4572309
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	65%
IMG OID	640141641
Product	GTP-dependent nucleic acid-binding protein EngD
Protein accession	YP_001072595
Protein GI	126436904
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0012] Predicted GTPase, probable translation factor
TIGRFAM ID	[TIGR00092] GTP-binding protein YchF

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.567593
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCGCCG GACTCTGGCA GACTGTCATC CCTGTGGGGC TCAACCTGGG AATCGTCGGA 
CTGCCGAATG TCGGTAAGTC GACCCTGTTC AACGCGCTGA CGCGCAACAA CGTGCTCGCC 
GCGAACTACC CGTTCGCGAC GATCGAGCCC AACGAAGGTG TGGTCGCGCT GCCGGACCCC 
CGGCTCGAGG CGCTCGCGAA GATCTTTCAT TCCGAGAAGA TTGTGCCTGC GCCGGTGACG 
TTCGTCGACA TCGCCGGCAT CGTCAAGGGC GCCTCGGAGG GGGCGGGACT GGGCAACAAG 
TTCCTCGCCA ACATCCGCGA ATGTGATGCG ATCTGCCAGG TCGTGCGCGT CTTCGCCGAC 
GACGACGTCG TCCACGTCGA CGGCAAGGTG GACCCGAAAT CCGATATCGA GGTGATCGAG 
ACCGAGCTGA TCCTCGCCGA CATGCAGACG TTGGAGAGGG CCGTGCCGCG GCTCGAGAAG 
GAAGCCCGCA CCCACAAAGA CCGCAAACCC GTCCTCGACG CGGCCCTCGC CGCGCAGGAG 
GTGCTCAATT CGGGCAAGAC GCTGTTCGCG GCCGGTACCG ACGTCAGCCT GCTGCGTGAG 
CTGAACCTGA TGACCACCAA ACCGTTCCTC TACGTGTTCA ACGCCGACGA GTCCGTGCTG 
ACCGATGAGG CGCGCAAGGT GGAACTGCGG GAGCTCGTTG CGCCCGCCGA CTGTGTGTTC 
CTCGACGCGA AGATCGAAGC GGAACTGCAG GAGCTCGACG ACGAGTCGGC CGCCGAGCTG 
CTCGAGTCGA TCGGGCAGAC CGAGCGCGGT CTGGACGCGC TGGCGCGGGC CGGGTTCCAC 
ACGTTGAGAC TGCAGACCTA CCTCACCGCG GGCCCGAAGG AGGCGCGCGC CTGGACGATC 
CACCAGGGCG ACACCGCACC GAAGGCCGCG GGCGTGATCC ACAGCGACTT CGAGAAGGGC 
TTCATCAAAG CCGAGATCGT CTCGTTCGAC GATCTGGCCG AGGCAGGCTC GATGGCCGCG 
GCGAAGGCGG CCGGCAAGGT CCGCATGGAG GGCAAGGACT ACGTGATGGC CGACGGCGAC 
GTGGTGGAGT TCCGCCATGG ACAACCATCT ACGTCGAAAG CCAAGGCTTA G

Protein sequence

MPAGLWQTVI PVGLNLGIVG LPNVGKSTLF NALTRNNVLA ANYPFATIEP NEGVVALPDP 
RLEALAKIFH SEKIVPAPVT FVDIAGIVKG ASEGAGLGNK FLANIRECDA ICQVVRVFAD 
DDVVHVDGKV DPKSDIEVIE TELILADMQT LERAVPRLEK EARTHKDRKP VLDAALAAQE 
VLNSGKTLFA AGTDVSLLRE LNLMTTKPFL YVFNADESVL TDEARKVELR ELVAPADCVF 
LDAKIEAELQ ELDDESAAEL LESIGQTERG LDALARAGFH TLRLQTYLTA GPKEARAWTI 
HQGDTAPKAA GVIHSDFEKG FIKAEIVSFD DLAEAGSMAA AKAAGKVRME GKDYVMADGD 
VVEFRHGQPS TSKAKA