Gene Msil_2203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2203
Symbol
ID	7093424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2381281
End bp	2382495
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	63%
IMG OID	643465523
Product	integrase family protein
Protein accession	YP_002362499
Protein GI	217978352
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTAATA AGATCAACAG GTTATCCGCG CGCACCGTCG CGGCCCTAAC CAAACCCGGC 
CGTCATGCCG ATGGCGGAAA TCTCTATCTA AGAATCGAAC GCAGCGGCTC GAAACGCTGG 
ACTTTCATGT ATGTCCAGGG CGGCCGGCAA AGGGAAGCCG GGCTCGGCTC GGTCGCCAGG 
ATGCCGCTCG CAAAGGCGCG GGTTAAAGCC GGAGAGTTGC GCCAAATGCT CGCCGACGGG 
ATTGATCCGC TCGCGGCCAA GCAGGCCGAG CGGGAGGCCC GGCAAGCAAT CGTCGAAGCG 
GAACAAGCTC GGCGCACATT CGGCCAGGTC GCCGACAGCC TCCTCGCTGC CAAAGAGGCC 
GGCTGGCGCA ACGCCAAACA TCGCGCGCAA TGGCGCATGA CCCTCGAAAC CTATGCGGCC 
TCCCTTTGGA ATATGCCCGT CGAGGAGGTC GATACGCAGG CCGTTCTCGC CGCCCTGCAA 
CCCGTATGGC AAGCAAAGCC TGAGACCGCA TCGCGGCTGC GCGGCCGCAT CGAGGCCGTG 
CTCGACGCCG CGCGCGTGGC GGGCCATTCG GGAGCCGATC GGCCGAACCC GGCCCGATGG 
AAAGGCCACC TCGACAAGCT GCTCCCCGCC CCCAAGAAGC TTTACCGCGG CCATCACGCC 
GCAATGCCTT ACGGTGAGCT GCCCGAGTTC CTTGCGCGCC TTCGAAAGCG CCCCGCTGTC 
GCTGCACTGG CGCTCGAATT TTTGATCCTG ACGGCCGCGC GCTCAAGCGA AGTTCTCAGC 
GCGGAGTGGA GCGAGGTCGA CCTTGCAGCG AAGGTTTGGG TGATCTCGGC GCGACGCATG 
AAAGGCGGCC GGGAGCATCG CGTGCCGCTT TCTAGCAGGG CGTTGGAGAT CCTCGAAAAC 
CTCGCCAAGA CAAAAACGGG CGCCTTCATT TTTTCCGGCC AAGATTTCAG GCGTTCGTTA 
TCATCCCATG CGTTTGTCAT GTTGCTGCGC CGCATGAAGG CCGATCATGT GACTGCGCAC 
GGTTTTAGAA GCTCTTTTCG CGATTGGGCC GGCGACGCGA CAAGTTTTCC GCGGGAGATC 
GCCGAAGCGG CGTTGGCGCA TGTAGCCGGC GATGCGACAG AGCTCGCCTA CCGTCGCGGC 
GATGCGCTTG AGAGGCGGCG CCCGCTCATG GAGGATTGGG CTGCTTTTTG CCTAGGCCAT 
AAACGCACTC AGTGA

Protein sequence

MVNKINRLSA RTVAALTKPG RHADGGNLYL RIERSGSKRW TFMYVQGGRQ REAGLGSVAR 
MPLAKARVKA GELRQMLADG IDPLAAKQAE REARQAIVEA EQARRTFGQV ADSLLAAKEA 
GWRNAKHRAQ WRMTLETYAA SLWNMPVEEV DTQAVLAALQ PVWQAKPETA SRLRGRIEAV 
LDAARVAGHS GADRPNPARW KGHLDKLLPA PKKLYRGHHA AMPYGELPEF LARLRKRPAV 
AALALEFLIL TAARSSEVLS AEWSEVDLAA KVWVISARRM KGGREHRVPL SSRALEILEN 
LAKTKTGAFI FSGQDFRRSL SSHAFVMLLR RMKADHVTAH GFRSSFRDWA GDATSFPREI 
AEAALAHVAG DATELAYRRG DALERRRPLM EDWAAFCLGH KRTQ