Gene Msil_3533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3533
Symbol
ID	7092390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	3881217
End bp	3882779
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	66%
IMG OID	643466824
Product	CHAD domain containing protein
Protein accession	YP_002363784
Protein GI	217979637
COG category	[S] Function unknown
COG ID	[COG3025] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.0421561
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAA TCGAACTGAA GCTCGCCGTT TCGGCCGATC CCGCGGCCCG CGCCCAAACG 
CTGGACGCCC TGAAGGACGC GATGGCCCGC GCCCGCGCGC AAACGCTCGA CTCCTGGTAT 
TTCGACACCG CCGATGAAGC GCTGCGCGAT GGCGGATTCA CTCTGCGGGT CCGGCGAGCC 
GGAAAACAGC TGCTGCAAAC GATCAAGCAG GACAGCGGAT CGGTTTCCCA GCGTGGCGAG 
TGGGAGCGCC CCATCGACGG CAAGGCGCCG ACGCGCAGAC AAGGCGCGAG CGCCGCCTGC 
GTCGATTTTG CGATGATTAG CGAGACGCCC CTTGCCGAAT TGGCCGAGGC GGCGCGTCCG 
GATCTGCGCC AGGCGTTTCA CATCTCGGTC AAACGCGCCT TTCTCTCGCT CAGCGAAGAG 
AATGCGCAGA TTGAGGCTGT CCTCGACAGC GGCGAGATCA CGGTCCCCGG ACCAACCGCC 
GCCGAGGCTA TCTTCGAGGT CGAGCTCGAA CTGAAAAGCG GCGGCAAGAG CGCCGTCTAC 
ACCTTGGCGC GCCGGCTGGC GGCGAGGGCC CCCTTGTCGA TCAGCCTGAT CAGCAAGGCC 
GAGCGCGGCT ATCGCCTAGC GGCCGGAGCG TCGATGCGTC CGGCCAAGGG ATCGCAGCCG 
CGCCTGGGCG ACGCGATGAC GGCCGGCGCC GCGTTCGAGG CTATCTGCAA TGTCTGCCTG 
CACGACTTCA TGTTGAATGC GCGCCTCCTT ACGGCGCGGC CCGCGCCGGC CCATCCCGTC 
GAGGCAATCC ATCAGGGCCG CGTCGCGCTG CGGCGCCTCA GGGCCGCGCT CGCTCTGTTC 
CAGCCCATTG CTGGCGACGA ATATTTTGCT GCGGCGAACG ACGAATTGAA ACGCATGGCG 
CGATTGTTTG GCGCTGCGCG AGATCGCGAC GTCATGCATG AAGCGGAAAT CAAGGCCGCC 
CGCGGCGAGC TCACAGGCGA GGCGCGCGAA TTTGCCGCTT GGCGCGACTC CAAACGCCTG 
GCCCTGCGCG CCGCCCTGAT CGAGGCGATC GAAGCAAAAC CCTGGCGGAT CTTTTTGATC 
GATTTCTGCG AATGGCTGGG AAGCGGCGGC TGGCGGGCGA AAAAGGCCGA GCGCGCCGAC 
ACGGCGAAAT TCATTCGCAA GCGGCTCGCC AAGCGGCGTA AGGCGCTCCT GCAACAGGGG 
GAAAACCTCG AGGGCCTCGA TCCGGAGGCG CGCCACAAGG TGCGGATCGA CGCCAAGAAG 
CTGCGCTATA TGGCCGAGTT CTTCATCGAC TGCCCGGAGG TCGCTGACAA AAAGAGCCTC 
GGCGCGCTTT TGAAGCGCCT TGAGACGATC CAGTGGTCGC TCGGCGAGAT GCATGACGCC 
GAAACGAGGC TGGATGCGGA CGAAGCGGAT CTTCGCCTTT GGCGTCAAGA AACCGGTCGA 
GTTGAATCCG GCGAACTCGC TCTCGCCGAC GCGCCCCTCG CCGCGCCGGC CGAGGACGGC 
CAGAAATGGC TCGGCGAGGC GCTGCGGGCC TTCGCCAAAC TCGCGAAGGA CGACCCGTTC 
TGA

Protein sequence

MTEIELKLAV SADPAARAQT LDALKDAMAR ARAQTLDSWY FDTADEALRD GGFTLRVRRA 
GKQLLQTIKQ DSGSVSQRGE WERPIDGKAP TRRQGASAAC VDFAMISETP LAELAEAARP 
DLRQAFHISV KRAFLSLSEE NAQIEAVLDS GEITVPGPTA AEAIFEVELE LKSGGKSAVY 
TLARRLAARA PLSISLISKA ERGYRLAAGA SMRPAKGSQP RLGDAMTAGA AFEAICNVCL 
HDFMLNARLL TARPAPAHPV EAIHQGRVAL RRLRAALALF QPIAGDEYFA AANDELKRMA 
RLFGAARDRD VMHEAEIKAA RGELTGEARE FAAWRDSKRL ALRAALIEAI EAKPWRIFLI 
DFCEWLGSGG WRAKKAERAD TAKFIRKRLA KRRKALLQQG ENLEGLDPEA RHKVRIDAKK 
LRYMAEFFID CPEVADKKSL GALLKRLETI QWSLGEMHDA ETRLDADEAD LRLWRQETGR 
VESGELALAD APLAAPAEDG QKWLGEALRA FAKLAKDDPF