Gene Msil_1736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1736
Symbol	ligD
ID	7090848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	1886469
End bp	1889135
Gene Length	2667 bp
Protein Length	888 aa
Translation table	11
GC content	66%
IMG OID	643465059
Product	ATP-dependent DNA ligase
Protein accession	YP_002362044
Protein GI	217977897
COG category	[L] Replication, recombination and repair
COG ID	[COG1793] ATP-dependent DNA ligase [COG3285] Predicted eukaryotic-type DNA primase
TIGRFAM ID	[TIGR02776] DNA ligase D [TIGR02777] DNA ligase D, 3'-phosphoesterase domain [TIGR02778] DNA polymerase LigD, polymerase domain [TIGR02779] DNA polymerase LigD, ligase domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.946456
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGGACA CCAAGCTCAA AACCTATCGC GCCAAGCGCG ACTTTGCTCA AACGGCGGAA 
CCGAGCGGAG AGGCTCCGAT CGCGGCCGGA CCGCGTCGGC GCTTCGTCAT CCAGAAACAT 
GCCGCAACCC GGCTCCATTA CGATCTTCGA CTGGAGCTCG ACGGAGTCTT CAAATCATGG 
GCTGTCACCA AGGGCCCCTC GCTCGATCCG CATGACAAGC GCCTTGCAGT TGAGGTCGAG 
GATCATCCGC TCGACTATGG CGATTTCGAA GGCGTGATCC CCAAAGGCCA ATATGGGGGC 
GGCACGGTCC AGCTGTGGGA TCGCGGGTTC TGGGCGCCGG AGGGCGACAA GACGCCTGAA 
CAGGCGCTGG CCGACGGCGA TCTCAAATTC ACGCTCGACG GCCAAAGGCT GTATGGCAGT 
TGGGTGCTCG TGCGCATGAA GGCCGACCGC ACGGGCGGCA AACGAACCAA TTGGCTGCTC 
ATCAAACATC GCGACGGCTA CGCGCGGGAT GGCGACGCCG ACGCTCTGCT GGCGGAGGAC 
CGCTCCGTCG CTTCGGGCCG CGCGATGGCG GCGATCGCGG CCGGCAAGGG CAAGGGGCCA 
AAGCCTTTCA TGCTCGCGGG CGAGCAAGCC GCCGATCCGA AAGCGGTGTG GGACTCGAAC 
AAGGGGCTCG CCGCCGAGGC GCGCGCGGCG CCCAAGGCCA CGCGGAAAAA ATCTGGCGCG 
GCTTTGGCGC AAATGCCGGA TTTCCTGCCG CCGCAGCTTT GCCAGCCGGT CGAGCGGCCG 
CCTTCGGGCG ACGGTTGGGT TCATGAAATC AAATTCGACG GCTATCGCAT GCAGCTTCGC 
GTCGCCGGCG GCAAAGCGAC GCTGAAAACG CGCAAGGGGC TGGACTGGAC CGATAAATTC 
GCGGCGATCG CTGCGGAGGC GGCGGATTTC CCCGACGCTA TCATCGATGG CGAGATCGTC 
GCGCTGGATA GCTCGGGCTC GCCCGATTTC GTGGCGCTGC AGGCGGCGCT TTCAGAACAG 
AATACCGATG ATCTGATTTT CTACGCCTTC GACCTGATGT TCGAGGGCGG GAGAGATTTG 
CGGCTCGAGC CGCTCGCCGC GCGCAAGCAG GCGTTGGCGC GTCTCATAGC CGGCGCGCGG 
CTTGGCGCGG GCGCGCTGAT CCGTTTCGTC GAGCACTTCG AGACCGGCGG CGACGCGATT 
TTGCAATCCG CCTGCCGCCT CAATCTGGAA GGCATCGTTT CAAAGAAACG CGACGCGCCC 
TACCAGCCCG GCCGCTCCGA CAGCTGGACC AGGGCGAAGT GCCGCGCCGG CCACGAGGTG 
GTGATCGGCG GATGGACGAC CACGGAGGGG AAATTCCGCT CCCTGTTGGC GGGCGTCCAT 
CACGGCGAGA ATTTCACCTA TATCGGCCGC ATCGGAACGG GGTTCGGCGA AGCCAAGGTC 
AAAACCCTGC TGCCGAAGCT GAAGCAGTTC GCGGCGGAGA CATCGCCCTT CACCGGGCCG 
AGCGCGCCAC GCAAAACCGC TTCGATCCAT TGGCTGAAGC CGGAGCTCGT CGCCGAGATT 
GAGTTTGCGG GGTTTACAGG CGCCGGCATG GTGCGGCAGG CGGCCTTCAA AGGGCTGCGC 
GAAGACAAGC CGGCCGAAGA GGTCGAAGCC GAGACGCCGG CCCCGCCGGA GCAAGCTGCT 
GTTCCCGATC CCGCAGAGAT TCAGGCGAGC GCGCGTTCAT CCTCGGATAA GCCCATGGCG 
ACGGCCAACG GCAAACCCAT CGTCATGGGC GTCGCCATCT CCAACCCGGC GAAGGAGTTG 
TGGCCGGCTG ACGGCGCCGA AGCTCCGGTC TCGAAACTCG ATCTGGCGCG CTATTACGAA 
GCGGCCGGTC CCTGGCTCAT AGAGCATGTG CGCGGCAGGC CTTGCTCGCT CATCCGCGCG 
CCCGACGGGA TCACTGGCCA GCAATTCTTT CAGCGCCACG CCATGGCCGG AGCCTCGAAC 
CTGCTCGATC TTGTGACCGT GTCGGGCGAT CGCGCGCCCT ATCTGCAGAT CGACCGTGTT 
GAGGGATTGG CGGCGGTGGC GCAAATCGCT GGGCTTGAGC TGCATCCGTG GAACTGCGCG 
CCGGGGCGCC CGGAGACGCC CGGGCGGCTG ATATTCGATC TCGACCCCGG CCCCGACGTC 
GCCTTCGAGC AGGTGGCAGC CGCCGCTCTT GAGATGCGCG ACAGGCTCGA CGCGCTGGGG 
CTCGTCAGTT TCTGCAAGAC GACGGGCGGC AAGGGGCTGC ATGTCGTCAC GCCGCTGGCG 
GTCGCCAAGG GCTCCAAACT CACCTGGCCC GAGGCGAAGG GGTTCGCTCA GGAGGTCTGC 
CGGCGCATGG CCGCGGACAA TTCGAACGCC TATCTCCTCA ACATGTCCAA AAAGCTTCGC 
GCGGGGCGTA TTTTCCTCGA CTACCTGCGC AATGACCGCA TGTCGACGGC CGTCGCGCCG 
CTGTCGCCAC GCGCGCGTCC GGGCGCCACG GTTTCGATGC CGCTGAACTG GAGCGAGGCG 
ACCAACAGCC TCGATCCGAA AGCCTTTACG ATCCGCACGT CCGTTGGGCT TCTCGACAAG 
AGCAAAGCCT GGGCCGACTA TGATTCGGGC GCGCGTCCGC TGGAGGCGGC GATCAAACGC 
CTCGGCCGCG CCAAGGCGGC CGCGTGA

Protein sequence

MADTKLKTYR AKRDFAQTAE PSGEAPIAAG PRRRFVIQKH AATRLHYDLR LELDGVFKSW 
AVTKGPSLDP HDKRLAVEVE DHPLDYGDFE GVIPKGQYGG GTVQLWDRGF WAPEGDKTPE 
QALADGDLKF TLDGQRLYGS WVLVRMKADR TGGKRTNWLL IKHRDGYARD GDADALLAED 
RSVASGRAMA AIAAGKGKGP KPFMLAGEQA ADPKAVWDSN KGLAAEARAA PKATRKKSGA 
ALAQMPDFLP PQLCQPVERP PSGDGWVHEI KFDGYRMQLR VAGGKATLKT RKGLDWTDKF 
AAIAAEAADF PDAIIDGEIV ALDSSGSPDF VALQAALSEQ NTDDLIFYAF DLMFEGGRDL 
RLEPLAARKQ ALARLIAGAR LGAGALIRFV EHFETGGDAI LQSACRLNLE GIVSKKRDAP 
YQPGRSDSWT RAKCRAGHEV VIGGWTTTEG KFRSLLAGVH HGENFTYIGR IGTGFGEAKV 
KTLLPKLKQF AAETSPFTGP SAPRKTASIH WLKPELVAEI EFAGFTGAGM VRQAAFKGLR 
EDKPAEEVEA ETPAPPEQAA VPDPAEIQAS ARSSSDKPMA TANGKPIVMG VAISNPAKEL 
WPADGAEAPV SKLDLARYYE AAGPWLIEHV RGRPCSLIRA PDGITGQQFF QRHAMAGASN 
LLDLVTVSGD RAPYLQIDRV EGLAAVAQIA GLELHPWNCA PGRPETPGRL IFDLDPGPDV 
AFEQVAAAAL EMRDRLDALG LVSFCKTTGG KGLHVVTPLA VAKGSKLTWP EAKGFAQEVC 
RRMAADNSNA YLLNMSKKLR AGRIFLDYLR NDRMSTAVAP LSPRARPGAT VSMPLNWSEA 
TNSLDPKAFT IRTSVGLLDK SKAWADYDSG ARPLEAAIKR LGRAKAAA