Gene Mjls_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_4037
Symbol
ID	4879745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	4268406
End bp	4269746
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	68%
IMG OID	640141348
Product	TetR family transcriptional regulator
Protein accession	YP_001072302
Protein GI	126436611
COG category	[K] Transcription
COG ID	[COG1309] Transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.755951
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAAG CCTCGATCGT CCGCCGAGCC AGCTACGGCC CCTCCAGCCC TGCTGTGGGT 
GCCCGCGGCG CCACCACGCG TAGCCGGATC ACCGAGGTGT CGCTGGAGCT GTTCGGCCGA 
CTCGGGTACT TCGACACCTC GGTCGACGCG ATCGCCAAGG CGGCAGGTGT GTCCCGGGCC 
ACTCTCTATC AGTACTTCCA GGGCAAGGAC GAGATCTTCC TCGAGCTGCT CAACGAGTGC 
GGTAGCGCGC TGTTCCGGGT GGCCCGCCGC ATCGGCCCAC TCGGCCCCGA CGAAGTCGGC 
TTCGACAATC TGAACTGGTG GCTGGGCGAG TGGAGCTGGG TGTTCGAGAA GTACTCCACC 
ATGTTCGTGC AGTGGACGGC GATCGCCTCG TCGGACACAA AGGTGCGGCC GCAGATCACC 
CGGTTCGTCC GTAGCTACAA CCACCGCGTC GCCGAGCGGC TGGCCGCGTC CGGACTGCAG 
GGTCTGGACC CGGAGGTGGC GGCCATGACC ATGACCGCAC TGGTGCACCG CATCAACCTG 
TTCGTGCACA CCGACGGTGC CTATGGCCGA AGCGCGAAGG ACGCGGTCGA CACGCTTTCG 
GTGTTTCTGC AGCTGGCGTT GTTCCCCGAC ACCCCGCCGT CGGTGCTGAC GTCGCTGCGT 
CTGCGCGCCA GCGCCGACCC GGCGGCCGAC GTGGACGCCG TCGAGGTGCC TGCGGCTCCG 
GACGTCGAAG GACTGTCCAT CAGCGAGCGC ACCGCCACCC TGAGCAAGCG AGCCGTGAGT 
ACCGTGACGG CGTTGGCCGC CGCGGGCGCC GCCCAGTTCC GTGCCCACGG CTACCGCAGC 
ACGAGTGTGG ACGACATCGT GGAGGCGGCC GCCGTCGCCC GGGGCACCTT CTACAAGTAC 
TTCAACGACA AGCAGGATTT ACTGGCCGCG GTGGCCGCCG AGATCTATAC CGCTGCAATG 
ACGTTCGCGG AGCGCATCGC CGACGTGGAC CCCGTGGCGG ACGAGCAGAC GCTGCGGAAC 
TGGCTGGCCA CCTACGTTGA GTTCTACGAC CGGTACTCCG GCTGCATCGA AGCGTGGGCG 
GAAGGCGCCA CCGACGACCC CACGATCGTC GGGATCGGGG AGAACGGCCA GGTCCTGATG 
GATGTCGGCG CGGCCAGGAT GTTGATCGGC CGACCGGGCC CCTACCCGTT CGACCCGGTA 
GTCGCAGCGC TGATCCTGCG CGCACTGGTC ACCCGTGTCC GGCAGGCCGC GCTGGATCTG 
CCCGAGCCGA TCCACGACGA CGAGATCGTG GAGTTGTTGA TGACGCTGAT CCGGCGCGGC 
TTCTTCGGCC TCGCGACGTA G

Protein sequence

MAEASIVRRA SYGPSSPAVG ARGATTRSRI TEVSLELFGR LGYFDTSVDA IAKAAGVSRA 
TLYQYFQGKD EIFLELLNEC GSALFRVARR IGPLGPDEVG FDNLNWWLGE WSWVFEKYST 
MFVQWTAIAS SDTKVRPQIT RFVRSYNHRV AERLAASGLQ GLDPEVAAMT MTALVHRINL 
FVHTDGAYGR SAKDAVDTLS VFLQLALFPD TPPSVLTSLR LRASADPAAD VDAVEVPAAP 
DVEGLSISER TATLSKRAVS TVTALAAAGA AQFRAHGYRS TSVDDIVEAA AVARGTFYKY 
FNDKQDLLAA VAAEIYTAAM TFAERIADVD PVADEQTLRN WLATYVEFYD RYSGCIEAWA 
EGATDDPTIV GIGENGQVLM DVGAARMLIG RPGPYPFDPV VAALILRALV TRVRQAALDL 
PEPIHDDEIV ELLMTLIRRG FFGLAT