Gene Msil_3103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3103
Symbol
ID	7092781
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	3407813
End bp	3408823
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	64%
IMG OID	643466413
Product	DNA polymerase LigD, ligase domain protein
Protein accession	YP_002363374
Protein GI	217979227
COG category	[L] Replication, recombination and repair
COG ID	[COG1793] ATP-dependent DNA ligase
TIGRFAM ID	[TIGR02776] DNA ligase D [TIGR02779] DNA polymerase LigD, ligase domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGT CCCCGCCAGC AAAGCCGCGC TCGATCAGCT GCAAGACAGA TGTCGTCGCG 
GATGGGTTGA GGAGTCGGCC GCTTGTCTCG GCTGATCCGA CAGTCCCCCA GCTCTTCGAT 
GCGCCGCTGC CGGGCTGGAT CGCGCCCTGT TTGCCGACGC TCGTCCCCAA GCCGCCGGCC 
GGCGAAGAAT GGGTTCACGA AATCAAATGG GACGGCTATC GGGTTTCAGC TTACGTCGAG 
CCAGGCGCCG TCACGATCCG CACGCGCAAC GGCTATGATT GGACGGCGAG ATTTCCGACG 
ATCGCCGCTG CGCTCGGCAA GCTGAAGGTG CGGTCGCTGG TTATCGACGG CGAGGCGAGC 
GTGCTCGACG AGAAAGGCCG TTCGAGCTTC GCCGAGCTGC AAGCCGACCT TGCAACGGGC 
GGCGCGCAAC GAGCCGTGCT TTACGCCTTC GATCTGCTTT TCCTCGATGG GGAAGACTGG 
CGCCAGCGGC CGCTAGACGA GCGGCGCGGG GCCTTGGCCG GCCTGATCAA GAAAAAGCCG 
CCGCTGCTTC TCAGCCAGGA ATATGCCGGA ACTGGCGTCG ATTTTTTCAA GGTCGCTTGC 
GAGCATGAGC TCGAAGGGAT CGTCTCGAAG CGCCTCGACA AGCCTTACCG ATCCGGCCGC 
AGCAAGGATT GGCTGAAGAC CAAATGCGTG CAGAGCGGGG AATTTGTCGT GATCGGCTAT 
CAGCCCTCGT CCGGCGCGGT CCGGGCGCCC CTGGCCAATA TCAAGGTCGC GCGATGGGAA 
GAAGGCGCGC TGCGCTACGC GGGAGCAGTG GGAACAGGCT TCAGCGAGCG CGTCGCCAGG 
ATGCTGCGCG ACAGGCTTGA CGGCCTCAGG ACGCCGCGCT GTGCGATCCC AAGGCTCAAG 
GTTGGGGGCG CAGTTTGGAC GAAGCCCGAT CTCATCGTTG AGATTGATTA TCGCGGCCTC 
ACTGCGGACG GCGAGCTTCG CCATGCGAGC TTTCGCGGGA TCGCAGAATG A

Protein sequence

MAKSPPAKPR SISCKTDVVA DGLRSRPLVS ADPTVPQLFD APLPGWIAPC LPTLVPKPPA 
GEEWVHEIKW DGYRVSAYVE PGAVTIRTRN GYDWTARFPT IAAALGKLKV RSLVIDGEAS 
VLDEKGRSSF AELQADLATG GAQRAVLYAF DLLFLDGEDW RQRPLDERRG ALAGLIKKKP 
PLLLSQEYAG TGVDFFKVAC EHELEGIVSK RLDKPYRSGR SKDWLKTKCV QSGEFVVIGY 
QPSSGAVRAP LANIKVARWE EGALRYAGAV GTGFSERVAR MLRDRLDGLR TPRCAIPRLK 
VGGAVWTKPD LIVEIDYRGL TADGELRHAS FRGIAE