Gene Msil_0204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0204
Symbol
ID	7090521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	214046
End bp	215653
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	65%
IMG OID	643463538
Product	FAD dependent oxidoreductase
Protein accession	YP_002360547
Protein GI	217976400
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.32401
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCG ATCTTATCGG CCATAAGGAT CAAGGTTCCG AACCGATCAC GGCTGATGTG 
CTCGTCATCG GCGCCGGCAC GGCCGGTCTC GTCATCGCTG CCCGTCTTGC CGCGCAAGAT 
CTTAGGGTGG TCGTGCTGGA ATCGGGGGCG CGTCAGCAGG AGAAGGACGA GCACCCGCTG 
AACGAAGTGG TCCAGCTGCG TTCAATTTAT ACCGGCGCGT CGCGCGGCCG ATTCCGCTGT 
CTCGGCGGAA CCTCGACGCG GTGGGGCGGC GCGCTCATCC CCTTCGTTCC GGCGGATATG 
GATCCGGCCC TTTGGCCGGT GTCTCACGGC GAGCTCTGCG CCTATCTGCC GGACGTCGAA 
GAGCTCTTCG GCCTTGCGCC GGGAACCTAT GACTGGACCG ACTGGGCCAA GTTCGGCGGC 
GCGCAGTCCG ATCACGTCGC GCGCCTGGCG AAATGGCCCC CCTTCGGCAA GCGCAACGTC 
GCCAATTTGC TGTCGTCATC GATCGATCGC GCAGACGGGG CGGAGATCTG GCTGAATGCG 
ACGGCCACCC GCTTCGACAT CGGCGATGAC AGACGCCTGG GAGAGGTGAC CGCCGAAGCG 
CCGGACAAAT CGAAGCTGCG CGTCCGCGCG CAACATGTCG TCATCGCCGC CGGAGCGATC 
GAAAGCACGC GCCTTCTCCT TCTCGCGGAT CGACAGAACG GCGACAAATT CTTCGCGCCG 
GACGGCGTGC TTGGGCGTTA TTTTCACGAC CATCTTTCGG TCGGCGTCGG CGACATCGAG 
GCGAAGGACA GGACGGCCCT GAATCGCGTC GCCGGATTTC GCTTCGAAAA AGGCGGAAGC 
ATGCGCAACC TCCGTTTCGA GCTGTCCGAG AATGCGCGGC AGCGGGAGCA TCTGCCGGCG 
TGCTTCGCCC ATATCGCTTT CGAGGAAACC AGCCGCAGCG GCTTTGAAGC GTTACGAGCC 
GTTTACCGCC AGCTGCAAAA GCGGCGCAAT CCCAGTTTCG CGACGCTGAT GGAGCTCGCG 
CGCGGCTTTC CTTGGCTGTC GCGCGCCGTG TGGTGGCGAT TCGTCGAAGG GCGGCTGCTT 
TATCCCTCCG ACGCCTCCAT CAAGCTCATC ATGGTGCTCG AGCAGCCGCC CCGCGCGGAG 
AACAGGATTT TCCTGTCCGA CGATCGGCGC GATGTCTACG GCCAGCCTCT CGCGGTGATC 
GACTGGGCGG TCGGGGCGGA GGATCAGCGA GCCATGACGG AAGTCACCGA TCTGTTCATG 
AAAAGCTGGG CGGGGACCGG CCTTGCCGGC CTTGGACAGA TCCACAGGCG CCCGCCGCAG 
GAGGCCGAGG CCGATGTCGC CGGCGGCGGC GGCATCTTTC ATCCGGGCGG CACGGTCCGG 
ATGGGGCGAA CGCCGGCGGA CGGCGTATTG AACGGCGATC TTCGCGCCTT CCGGGTTCCC 
AACGTGCATG TGATTTCGAC CGCAGCCTTC CCGACCGGCG GCGGCGCCAA TCCAACCATG 
ATGCTGATGA TGTGCGCCAT GCGATGCGTG GCTCAGCTTT CGAAGGAGCT GAAGCCAACC 
TCCCCCGGGA CTTCCCCGGC GACGACGGCG CTGGCCGAAG CGCGCTGA

Protein sequence

MIRDLIGHKD QGSEPITADV LVIGAGTAGL VIAARLAAQD LRVVVLESGA RQQEKDEHPL 
NEVVQLRSIY TGASRGRFRC LGGTSTRWGG ALIPFVPADM DPALWPVSHG ELCAYLPDVE 
ELFGLAPGTY DWTDWAKFGG AQSDHVARLA KWPPFGKRNV ANLLSSSIDR ADGAEIWLNA 
TATRFDIGDD RRLGEVTAEA PDKSKLRVRA QHVVIAAGAI ESTRLLLLAD RQNGDKFFAP 
DGVLGRYFHD HLSVGVGDIE AKDRTALNRV AGFRFEKGGS MRNLRFELSE NARQREHLPA 
CFAHIAFEET SRSGFEALRA VYRQLQKRRN PSFATLMELA RGFPWLSRAV WWRFVEGRLL 
YPSDASIKLI MVLEQPPRAE NRIFLSDDRR DVYGQPLAVI DWAVGAEDQR AMTEVTDLFM 
KSWAGTGLAG LGQIHRRPPQ EAEADVAGGG GIFHPGGTVR MGRTPADGVL NGDLRAFRVP 
NVHVISTAAF PTGGGANPTM MLMMCAMRCV AQLSKELKPT SPGTSPATTA LAEAR