Gene Msil_3591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3591
Symbol
ID	7092450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	3949908
End bp	3951860
Gene Length	1953 bp
Protein Length	650 aa
Translation table	11
GC content	60%
IMG OID	643466880
Product	PAS/PAC sensor hybrid histidine kinase
Protein accession	YP_002363839
Protein GI	217979692
COG category	[T] Signal transduction mechanisms
COG ID	[COG2202] FOG: PAS/PAC domain [COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains [COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAGG ACGAGCGATT GAGCGGATCG GAGGCCGAAG AGGGGCGGTT CCGACTCCTG 
CTCGACGCCG TAACCGACTA TGCGATCTAT ATGCTTGATC GTGATGGCGT CGTCACAAGC 
TGGAACACGG GCGCGCGGCG GTTCAAAGGG TACGAAGAAT CCGAAATTCT CGGGCGGCAT 
TTCTCGACGT TTTATACCGA GGAAGACCGC AAGGCTGGAT TGCCCGCCAG AGCGCTCGAG 
ACTTCGGCCA GGGAAGGGAA ATTTGAAGCC GAGGGTTGGC GTCTGAAAAA GGACGGTTCG 
CGCTTCTGGG CGCATGTCGT CATCGATCCC ATCCGTCAGT CGGGAAAACT TGTGGGATTC 
GCCAAAGTCA CGCGCGATCT CACGGAACGG CGCGCCGCGG AGGCGGCGCT TCGGCGCACC 
GAGCATATGT TTAAGCTGCT CGTTCACGGC GTGACGGACT ATTCAATCTA CATGCTCGAT 
CTGGATGGGC GCGTGGCCAC CTGGAATCAG GGCGCACAAC GGATAAAGGG CTATCTGCCG 
GACGAAATCA TAGGCGAACA TTTCTCGCGC TTCTATACAC AGGAAGATCT CGCTACGGGC 
GAGCCGCGGC GCGCGCTTGA AACAGCATAC CGAGAGGGAC GATTCGAAAA GGAGGGATGG 
CGGGTCCGAA AGGACGGCAG CCGTTTTTGG GCCAATGTCG TCATGGACGC CATCCGCGAC 
GAAAGCGGCG CCGTGCTGGG TTTTGCTAAA ATTACGCGCG ATATCACGGA GCGGCGCGAC 
GCCCAGCGCG CGTTGGAACT GGCGCGGGAG GCGTTGTTCC AGTCACAGAA ATTGGACGCC 
ATAGGGCAGC TTACGGGCGG CGTGGCGCAC GACTTCAACA ATCTCCTGAT GGCGATCTTG 
GGTAGTCTCG AGCTCGTTCA GAAGCGTCTT CCCGCCGATC CGAAAATCGC GTCCCTGATC 
GATAATGCAA TCTTGGCGGC CCAGCGTGGC ACATCGCTGA CACAGCGCAT GCTCGCTTTT 
GCGCGGCGCC AAGAGCTGGA GCTCGAGCCG GTGGACGTAT TGGCGCTCGT GCGTGGAATG 
ACGGATCTTC TCCAGCGCTC CATTGGCCCC TCTGCGCCGA TCGAGGTGCG ATTTCCGCTG 
GCGCTCGAGC CTGTTCAGGC GGACGCCAAT CAGTTGGAGC TGGCGCTGCT CAACCTCGTC 
GTAAACGCGC GGGATGCGAT GCCGAACGGG GGCGCGATCA TCATTGCTGC CCGACAGGAA 
GCGATCGTCG AGCAAGCCGC CGTGGGCCTC GCCCCGGGCC GCTATATTTG TCTGTCGGTC 
CAGGATACGG GCGAAGGCAT GGATCAAGCG ACGCTGGATC GAGCAAAAGA ACCGTTTTTC 
ACAACCAAGG GGGTCGGCAA GGGCACGGGT CTGGGATTGC CGATGGTTCA CGGCGTCGCC 
GAGCAGTCGG GCGGGCGCCT GATTTTGAAG AGCCAGAAAG GCGCCGGCAC GACGGCAGAG 
ATTTGGCTGC CTGCTGCGAC AACGGCGTTG CAGCCTTCGC TCGCCAAACT TACGCCTTCA 
GAGAGTTGCC CGGTCACTCA TCCGCTAACG GTGTTGGCCG TCGATGATGA TCATCTTGTT 
CTGACGAATA CCGCTGCGAT GTTGGAGGAT CTTGGGCACA AGGTCTTTAC CGCGCTGAGC 
GCTGAGCAAG CCCTTAACGT TTTGAGATGC GAGAAAACGG TCGATCTTCT CATAACGGAT 
CAGGCCATGC CGTTCATGAC AGGCACGCAA CTCACCGACG CAATTCGCGA AGAGCGGCGA 
GATTTGCCTG TGATCTTGGC GACCGGCTAC GCCGAGTTTC CGCCAGGAAC GGCGGAGGAT 
CTGCTACGGC TTGCAAAGCC ATTCGGTCAA ATGCAGCTCG CGCGCGCCAT CTCAAGGGTG 
ATTGGGACGC GTGGCCAAAG GCGGGAGCCT TAA

Protein sequence

MNQDERLSGS EAEEGRFRLL LDAVTDYAIY MLDRDGVVTS WNTGARRFKG YEESEILGRH 
FSTFYTEEDR KAGLPARALE TSAREGKFEA EGWRLKKDGS RFWAHVVIDP IRQSGKLVGF 
AKVTRDLTER RAAEAALRRT EHMFKLLVHG VTDYSIYMLD LDGRVATWNQ GAQRIKGYLP 
DEIIGEHFSR FYTQEDLATG EPRRALETAY REGRFEKEGW RVRKDGSRFW ANVVMDAIRD 
ESGAVLGFAK ITRDITERRD AQRALELARE ALFQSQKLDA IGQLTGGVAH DFNNLLMAIL 
GSLELVQKRL PADPKIASLI DNAILAAQRG TSLTQRMLAF ARRQELELEP VDVLALVRGM 
TDLLQRSIGP SAPIEVRFPL ALEPVQADAN QLELALLNLV VNARDAMPNG GAIIIAARQE 
AIVEQAAVGL APGRYICLSV QDTGEGMDQA TLDRAKEPFF TTKGVGKGTG LGLPMVHGVA 
EQSGGRLILK SQKGAGTTAE IWLPAATTAL QPSLAKLTPS ESCPVTHPLT VLAVDDDHLV 
LTNTAAMLED LGHKVFTALS AEQALNVLRC EKTVDLLITD QAMPFMTGTQ LTDAIREERR 
DLPVILATGY AEFPPGTAED LLRLAKPFGQ MQLARAISRV IGTRGQRREP