Gene Msil_3098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3098
Symbol
ID	7092776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	3403128
End bp	3404414
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	61%
IMG OID	643466408
Product	integrase family protein
Protein accession	YP_002363369
Protein GI	217979222
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAAA ACGTTCGCGA CAACGCCCTC GGGTCCCGTG CTTCGCGTGA AAAACTGAAG 
GCTTCCGGCA AGCCCTATTA TCGCTCGCTC GACGCCGGGC TTCTGCACCT CGGCTATCGG 
AAAGGGCGGC ACGGCGGCAA ATGGGTTATG CGGCGCTATC TCGGAAACGA GAAGTACGAG 
GTGGAGACCA TCGCCGTTGC GGACGATCGC GACGACGCCG ATGGAAAAGA CATCCTCACC 
TTCAATGAGG CCCAGGCCAA AGCGAGAGAG ATCGCCAAAG CCCGGCGTCA GGAAGCCAGC 
GGCGCGGCGC CGATCACGAT CTCGACGGTC CTCGACGCCT ATCTCAAGCA AGCCGAGGCT 
CAGCATTCGA AATCGGTTTC CGACTCTCGC AATCGGATCG AAAACCATAT CCGCCCGGCT 
TTCGGCGCCA TGCTGGCATC CGATCTGACA CAGGAAGCGA TCCAGAAATG GCTGAAGGCC 
CTCGCCGACA GTCCGCGCAA TGTCCGCGGC AAGGCCGGAA CAGTGTCGAG AGCACTGGCC 
AAGCCGAAGA CCGATGATGA AAAGCGTCGA CGCCGCGCCA GCGCCAATCG GACGCTGACG 
ATCCTGCGAG CCGCGCTCAA TCAAGGTTTC CGTTCGGGCA AGATCACTTC GGACACCGTA 
TGGCGGACCA TCCAGCCTTT CCGCGAGGTC GATGCGCCGA GGGTGCGCTA TTTCACCCAG 
GATGAGGTCC GGAGGCTTGT TAATGCGGCT CAGGGCGAGT TTCGATCGCT GGTCAATGCC 
GCGCTGTTCA CCGGCTGCCG ATACGGCGAG CTATGTCGCC TGCAGGTCGG CGATTTCAAT 
CCAGACGCCG GGACCGTCTT CGTCGGGCAG AGTAAATCGG GCAAGGCGCG GCACGTCGTC 
TTGACCGAGG AAGGACAAGG TTTCTTCCGT CAGCTAACTG CCGGCCGGCC GACCAACGCT 
TTGATGCTTT CGAGGGCCGA TGGCGCTCCA TGGGGCGCGT CGCATCAGAT CCGGCCGATG 
GCTGAGGCCT GCAAGGCCGC CAAGATCGCC AAGGCGGGCT TTCATATCCT CCGCCACACC 
GCGGCGAGTC ACAATGTCAT GGGCGGCGTG CCGATGCCGG TCGTGGCGAA GAACTTAGGT 
CACGCTGATT CGCGGATGAC GGAGAAGCAT TACGCGCACC TCGCGCCGTC CTATGTCGCC 
GATCAGATCC GGCAATTTGC GCCGACGTTC GGAACGGTGC AGCAGACGAA CGTGGCGTTA 
CTTCATAAAT CGACCAAGGC GAACTGA

Protein sequence

MAKNVRDNAL GSRASREKLK ASGKPYYRSL DAGLLHLGYR KGRHGGKWVM RRYLGNEKYE 
VETIAVADDR DDADGKDILT FNEAQAKARE IAKARRQEAS GAAPITISTV LDAYLKQAEA 
QHSKSVSDSR NRIENHIRPA FGAMLASDLT QEAIQKWLKA LADSPRNVRG KAGTVSRALA 
KPKTDDEKRR RRASANRTLT ILRAALNQGF RSGKITSDTV WRTIQPFREV DAPRVRYFTQ 
DEVRRLVNAA QGEFRSLVNA ALFTGCRYGE LCRLQVGDFN PDAGTVFVGQ SKSGKARHVV 
LTEEGQGFFR QLTAGRPTNA LMLSRADGAP WGASHQIRPM AEACKAAKIA KAGFHILRHT 
AASHNVMGGV PMPVVAKNLG HADSRMTEKH YAHLAPSYVA DQIRQFAPTF GTVQQTNVAL 
LHKSTKAN