Gene Msil_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1049
Symbol
ID	7091877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	1136128
End bp	1137180
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	68%
IMG OID	643464388
Product	transcriptional regulator, AraC family
Protein accession	YP_002361380
Protein GI	217977233
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.049947
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGACA GCTCTTACGC CGCCAGGGCC GAAACGCTCG ATTCTTCGAA GACTGCTGTT 
CCGCATTTTT CCTTTTCTAC CAAAGATCTC CCGTCCACTG ACCAATTCGG CGCGTGGCGC 
GAATTTATGT CGTCGACCGT CGAAATCCAG CGGCTCGAAG GGAAAGAGCA GGGATTTGCG 
GCGGATCAAC AGGTGTGGAG CCTTGGCGCC TTCGCGCTGA CGCACGCCCT GATGCCGGGC 
GAGGGACATG CGCGCGCCTG GCGCCATCTT GGCAAGGATC CGATCGATCA CTGGTGCCTC 
GTCGTCGTCC GCGACGCCGG CCGCGATGGC TCGAGGCTGA TCGGACTGCG GTCGCTCGGG 
CGCCCGTTCG AAGGGGCGGC GGCTGACCGC GACGTGCTGT CCCTGTTCGC GCCGCGAAGC 
CTGTTTCGCG GCCTCTCCAG CCTGCTCGAC GCCGCGCCCG ACGTCATCGC CGACGTCGGC 
CTCGGCGCGA TTCTCGCCGA TTATCTGCTC TCATTGCAGC GCAGGCTGCC CGGCGTAACC 
GAGGCCGACG CGCCGCAAAT CGTCGAAGCG ACGCGGGCGA TGATCGCCGC CTGCCTGACG 
CCGGCGGCCG ATTTGCGCGC CGCGGCGGAG GGCGCCATCG CTGCGACTGT GCTTGAGCGG 
GCCGATGCGA TTATTTCGGC CAATCTCGCC GCCAAGGACC TCGGCCCCGA ATTTCTCTGC 
CGCGCCCTCG GCGTCTCCCG CTCGCGGCTC TACCGGCTGT TCGAGCCGAC GGGCGGGGTC 
AGTCGGGCGA TCCAGCGCGC GCGGCTGATC CGGGCGCAGG ACGCCTTGCG CGATCCGGCC 
GACGGGCGCC CGATTGTCGT CATTGCCGAC GCGCTGGGTT TTGCCGATCC GTCGAGCTTC 
AGCCGGTCCT TCCGTCGAGA ATTCGGCCAT AGTCCCAGCG ACGCGCGGAG CGCCGGGGCG 
CTCGGCTTTT TAGCCCCGCT GGCCGCCGCC AAACCCCTCG TTTGCGCCCC GATCGATCGT 
CTCGGCGACG TCCTTCGCAG CCTTCATGCC TGA

Protein sequence

MDDSSYAARA ETLDSSKTAV PHFSFSTKDL PSTDQFGAWR EFMSSTVEIQ RLEGKEQGFA 
ADQQVWSLGA FALTHALMPG EGHARAWRHL GKDPIDHWCL VVVRDAGRDG SRLIGLRSLG 
RPFEGAAADR DVLSLFAPRS LFRGLSSLLD AAPDVIADVG LGAILADYLL SLQRRLPGVT 
EADAPQIVEA TRAMIAACLT PAADLRAAAE GAIAATVLER ADAIISANLA AKDLGPEFLC 
RALGVSRSRL YRLFEPTGGV SRAIQRARLI RAQDALRDPA DGRPIVVIAD ALGFADPSSF 
SRSFRREFGH SPSDARSAGA LGFLAPLAAA KPLVCAPIDR LGDVLRSLHA