Gene Mmcs_4344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_4344
Symbol
ID	4113174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	4620534
End bp	4621580
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	71%
IMG OID	638033490
Product	AraC family transcriptional regulator
Protein accession	YP_641505
Protein GI	108801308
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.309673
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCACCA ATCCGGGGGT TCAGCCTCAG CCCCGCACTG CGTCACCTGC AGAGGTACCT 
CCCATAGCAA GACATCTCGA CTCCCTTGGC GTCCTGGCAC GGACCCAGGT CAAGATCATC 
GATTCCGACG AGGCGGCGGC GTTCCTCGAC GACGCCTACG GCTCCCGCCT GCGGTTGTCG 
CGGCTGGCGA ATCCGACCGG CGGCCCGGTG CTGACCTACA GCCGTCACGA CGCCGGCTCC 
TTCACGATCG ACGACATGGC GATGGCCGGC GGGTTCACCG CGTCACCCGA CCCGCTGCAC 
AAGGTGCTCG CGGTGTGGGC GAACCGGGGC CGGATCGCAG GCCGGTGCGC CGGTATCGGC 
GGCCTGGCCC GCGCGGGCGA GGTCGCGCTG ATGGCCCAGC CGGACCTCCC GCACGATGCC 
GAAGCCGAGG ACGTCGCGCT CACGACGGTG CTGCTCGATC CGGCGCTGGT CGCGAGCCTG 
GCCACCGGTG TGCCGGAGGC CGAGGCCTCG CCGATCCGGT TCTCCCTGTT CCAGCCCGTC 
GACGACTCGG CCCGACAGCT CTGGCAACAG ACCGTCCACT ACGTCAAGGA GTGTGTGCTC 
GCCGACGAGG CGCTCGCCAC GCCGCTGGTG CTCGGCCATG CCGCCCGGCT CCTCGCCGCG 
GTGACGCTCG CGGCCTTCCC GAGCGCCTCG ACGGTCGCGT CCACCGCACA TGACCGCGAT 
GCCAAACCCG TTCTCCTGCA ACGGGCGATC GGCTTCATCG AGGAGAACCT CGCCAACGAC 
ATCGCCCTCG CCGACATCGC CGCGGCCGTC CACGTCTCGC CGAGAGCGGT GCAGTACATG 
TTCCGCCGCC ATCTGGAGAC GACCCCGCTG CAGTACCTCC GCCGGTCGCG CCTGCACCAC 
GCGCACATGG ACCTGCTGGC CGCGGACCCG GCTCGCGAGA CCGTCACACG GATCGCCGCC 
CAGTGGGGGT TCGCCCACAC CGGCAGGTTC GCGGTGATGT ACCGCGAGGC CTACGGGCAG 
AGCCCGCACA CCACCCTTCG CGGGTGA

Protein sequence

MSTNPGVQPQ PRTASPAEVP PIARHLDSLG VLARTQVKII DSDEAAAFLD DAYGSRLRLS 
RLANPTGGPV LTYSRHDAGS FTIDDMAMAG GFTASPDPLH KVLAVWANRG RIAGRCAGIG 
GLARAGEVAL MAQPDLPHDA EAEDVALTTV LLDPALVASL ATGVPEAEAS PIRFSLFQPV 
DDSARQLWQQ TVHYVKECVL ADEALATPLV LGHAARLLAA VTLAAFPSAS TVASTAHDRD 
AKPVLLQRAI GFIEENLAND IALADIAAAV HVSPRAVQYM FRRHLETTPL QYLRRSRLHH 
AHMDLLAADP ARETVTRIAA QWGFAHTGRF AVMYREAYGQ SPHTTLRG