Gene Msil_1418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1418
Symbol
ID	7091758
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	1533654
End bp	1535222
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	63%
IMG OID	643464756
Product	transcriptional regulator domain protein
Protein accession	YP_002361745
Protein GI	217977598
COG category	[S] Function unknown
COG ID	[COG5616] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTATC TTTTCGAAGA TTTTGAACTG GACACGGCCA GGGTCGAACT TCGGACGAAT 
GGCGTCGCGA TCGCGATCGA GCCACAGGTC TTTGCGCTGC TGTGTTTCCT CGTCGAAAGC 
CGTGACCGGG TCGCGACGAA GGAAGAGATC GTCGCGCGCG TTTGGAACGG GCGGGTCATC 
TCCGATTCCG CGATCGCCAG CCGCATCAAA TCGGCGCGCC GCGCGCTCGG TGACGATGGA 
GGCGCGCAGC GCCTCATCCG CACAATCCAT GGAATTGGCT TCCGCTTCGT CGCGGATGTC 
CGGCTGGCGG CGACGCGCAT CGAGTCCATC GCGCCCACGG CCGAGACGGC GCCGGATACG 
GATCGGTCGC AAGCCGTCGA GACGTCGCGG CCGAGCATTG CGGTCCTTCC TTTTCGCCTT 
CTCGGCGCGG CGGATCCGCA ATTTTCCATC GGCGACGCGC TTCCTCACGA TCTCATCACC 
GAACTGTCGC GGCTACGCTG GCTCTTTGTC ATCGCGAGAG GTTCGTCCTT CCGCTTTCGC 
GGCGCGGAGC CGGACGTCGG CCGCGTCCGG ACGGCGCTGA ACGTCCGCTA TTGCCTGTCC 
GGCGTCGTAG AGATCCACCA TAGCGCAATG ATCATCTCGG TCGAACTTTC CGACGCCGAG 
GACAGCGGCG TCGTTTGGAG CGAGAGATTT CGAACGCAAG CCAGCGCGGT GCATGAGATC 
CGCGAAGAGA TCGTCCGCGC CGTGATCAAT GCGCTCGAAT TGCAGATCCC GCTCAACGAG 
GCGCGTCGGG CGCGGCTGAA ATCGCCGGAG CGTCTCGACG CATGGTCAGC CTATCATCTC 
GGGCTGCATC ATATGTATCG CTTCAACAAA GCCGATAATT CTGTCGCAAC CGCGCTGTTC 
GAGCGCGCTG CCGCGATGGA GCCGGGATTT GCGCGCGCCT ATGCCGGCCT TTCGTTCACC 
CATTTTCAAA GCGCCTTTCT GAGCTACGCC GACAATGTTT CCGAGGCGGC GAATCTGGCG 
CAGCGCGCCG CCGAACAAAG CCTCGAACGC GATCCTGTCG ATCCTTTCGG CAATTTCACC 
ATGGGCCGCG CCTTCTGGCT TTGCGGCGAT CTCGACGCCA GTCTTCCCTG GCTGGAGCGC 
GCCAATGCGC TCAACCCGAA TTACGCCCAG GCCAAATATT CGCGAGCTTG GGCGCAGGCG 
CTGCTCGGCA ACGCTGCGTC GAGTCGCGCG AATGTGGACG AAGCGCTGGC CCTGAGCCCG 
CTTGACCCGC TTCTCTATGG CATGTTCGGC GTTCGCGCTT TTTCCCATCT TGTGATGGGA 
GAGTCCGCCG AAGCTGCGGA ATGGGCCGAG CGCGCGGCGC GCTCTCCCGG GGCGCACGCC 
TTGATCGAGA TGATCGCCGT CCTCGCGCAT GGCCTCAACG GAAACGATGC GCGCGCGAAA 
GCGTGGGCCC GTTCCGCGCG CGCTCGGGTT TGCGATCTCA ACAAGGCCGC CTTCCTGCGC 
GCTTTTCCGT TTCGCGACCA ACTCATGCTC AAGCGCGTTT CCGACGAGCT TGAGAGGTTC 
GGGTTTTAG

Protein sequence

MIYLFEDFEL DTARVELRTN GVAIAIEPQV FALLCFLVES RDRVATKEEI VARVWNGRVI 
SDSAIASRIK SARRALGDDG GAQRLIRTIH GIGFRFVADV RLAATRIESI APTAETAPDT 
DRSQAVETSR PSIAVLPFRL LGAADPQFSI GDALPHDLIT ELSRLRWLFV IARGSSFRFR 
GAEPDVGRVR TALNVRYCLS GVVEIHHSAM IISVELSDAE DSGVVWSERF RTQASAVHEI 
REEIVRAVIN ALELQIPLNE ARRARLKSPE RLDAWSAYHL GLHHMYRFNK ADNSVATALF 
ERAAAMEPGF ARAYAGLSFT HFQSAFLSYA DNVSEAANLA QRAAEQSLER DPVDPFGNFT 
MGRAFWLCGD LDASLPWLER ANALNPNYAQ AKYSRAWAQA LLGNAASSRA NVDEALALSP 
LDPLLYGMFG VRAFSHLVMG ESAEAAEWAE RAARSPGAHA LIEMIAVLAH GLNGNDARAK 
AWARSARARV CDLNKAAFLR AFPFRDQLML KRVSDELERF GF