Gene Msil_1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1990
Symbol
ID	7094188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2160579
End bp	2161964
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	68%
IMG OID	643465316
Product	transcriptional regulator, GntR family with aminotransferase domain
Protein accession	YP_002362294
Protein GI	217978147
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGACT GGACCCCCGA CCTCACCGGC AGCGACAAGC CGCGTTATCT CGCCATCGCC 
GATCTCATCG CCGAGGACCT CCGCAGCGGC CGGCTCTCGA TTGGCGATCG TCTGCCGCCG 
CAGCGCCAGC TCGCCGCCCG GCTCGGGGTT GACTTCACCA CAGTCGCGCG CGGCTATGTC 
GAGGCGAAAA AGCGCGGTCT TGTTGAATCG CGCGTCGGCC GCGGCACCTT CGTCTGCGCG 
CCGCCGCGTC AGGCGCCGCC GCCTCCAAGG CCTGCGCGCA GCGACTTCGT CGATCTGTCG 
ATGAATTTGC CTCCCGAACC GGACGATCCG GCCCTGATTG CGCGGATGCA GGATGGCGTG 
GCGGAGGTCA GCCGCGATCT CGTTTCGCTG CTACGTTATC AGGCCTTCGG CGGCTCTCCG 
GCGGACAAGG ACGCCGCCTC CGCCTGGCTC GGCCGGCGCT CGCTCGTTCC CTCGCAGGAT 
CGTCTGTTCG TGACGCCGGG CGCGCATCCG GCCCTGCTTG GAATCTTCAG CATTCTGGCG 
GCCCCCGGCG ACGTCGTCCT GTGCGAGGAA TTGACCTATC CCGGCATGCG CGCCATCGCC 
GCGCAGCTGC GCCTCAAACT GGTCGGCCTG CCGATGGACG CGGACGGCGT CGACCCTGAC 
GCCTTCAAAT CCTCCTGCGA GACGCTGAAG CCGAAGGCGA TCTATCTCAA TCCGACGCTG 
CACAATCCGA CGACGCTCAC CATCCCCGCG ACGCGGCGCG TCGCGATCGC CGCGGTTGCG 
CGGCGCTACA ATGTCCCGAT TGTCGAGGAC GACGCCTATG GCTTCATTCC CACGCAAGGC 
CAGCCGCCGT TTGCGGCCAT TGCGCCCGAC CTCACCTGGC ATGTGGCGGG CCTTGCCAAA 
TGCATAGGCG CGGGCCTGCG CGCCGCCTAT GTTGTCGCGC CCGACGCGCG CTCCGGCTGG 
CCTTTCGCCG CCGCCATGCG GGCGGCCAAT GTCATGGCCT CGCCGCTGAC GGCGGCCATC 
GCCACGCGTT GGATCGAGGA CGGCGCCGCC GACACCATTT TGCGGTTCAT CCGCGCCGAG 
ACCGCGGCGC GTCAGCAACT CGCCGCCGAC ATTCTGCCAA AGGGCAGCTT CCGCTCCGAT 
CGCCTCAGCT TCAATCTCTG GATGGAGCTG CCAAAACCCT GGACCCGTTC GGCCTTCATC 
GGCCACATGG GATCGACCCG GATCGGCGTC GTCGCCAGCG ACGCCTTCAC CGTCGGCGGC 
GATCCGATCG AGGCGATCCG CATCTGCATC GGCGGTCCGA CCGGACGCGA AGAGATCCGC 
TCAGCGCTGG AATATATCGC GCATGCGCTG GCGCAATCGC CGGCGCATGC GCTGCAATTT 
CTGTGA

Protein sequence

MPDWTPDLTG SDKPRYLAIA DLIAEDLRSG RLSIGDRLPP QRQLAARLGV DFTTVARGYV 
EAKKRGLVES RVGRGTFVCA PPRQAPPPPR PARSDFVDLS MNLPPEPDDP ALIARMQDGV 
AEVSRDLVSL LRYQAFGGSP ADKDAASAWL GRRSLVPSQD RLFVTPGAHP ALLGIFSILA 
APGDVVLCEE LTYPGMRAIA AQLRLKLVGL PMDADGVDPD AFKSSCETLK PKAIYLNPTL 
HNPTTLTIPA TRRVAIAAVA RRYNVPIVED DAYGFIPTQG QPPFAAIAPD LTWHVAGLAK 
CIGAGLRAAY VVAPDARSGW PFAAAMRAAN VMASPLTAAI ATRWIEDGAA DTILRFIRAE 
TAARQQLAAD ILPKGSFRSD RLSFNLWMEL PKPWTRSAFI GHMGSTRIGV VASDAFTVGG 
DPIEAIRICI GGPTGREEIR SALEYIAHAL AQSPAHALQF L