Gene PCC8801_1937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1937
Symbol	mutL
ID	7102885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2014559
End bp	2016244
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	45%
IMG OID	643474998
Product	DNA mismatch repair protein
Protein accession	YP_002372131
Protein GI	218246760
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTCCC CTATCCAACC TTTACCCTTA AATGTTATTA ACCTGATCGC TGCTGGAGAG 
GTAATAGACT CCATCGCAGC AGTGGTAAGG GAATTGGTAG AAAATGCCTT AGATGCCGGG 
GCAACTCGTT TAGTAATTTC GCTATTTCCT GAAAGTTGGC GAGTTCAGGT AGCCGATAAT 
GGAACCGGAA TGACGTTAGC CGATCTCCGT CACTGTGCCT TACCCCACAG TACCAGCAAA 
ATTCATCAAC TTGATGATCT GTGGAAAATT ACGACTTTAG GGTTTCGCGG AGAAGCATTA 
CACAGTTTAG CCCAAGTAGC CGATTTAGAA ATTGCCAGTC GCTGTACCTC TGATGGAGTA 
GGATGGTGTT TGCGCTATCA GTCTTCAGGA GAACCCCTCA GGGAAGAACC CACCGCGATC 
GCCCCTGGTA CGATTGTCAC GGTAGGGAAT CTTTTTGGCA AGATGCCTGT TCGTCGTCAA 
GGTTTACCAG CAATCTCAAC CCAACTCAAA GCAGTACAAA GTTTCATTGA AAATATGGCC 
TTGTGCCATC CCCAAGTCAC TTGGCAAGTC TGGCACAATC AGCGATTATG GTTAAATATT 
AGTCCAGGGA AAACCCCTCA ACAGATTTTA CCCCAACTCC TCAAGGGGGT TCATTATCAC 
GATTTACAGT TTGTTTCCCA AGGTGTTAAG AGTCCTCAAG AATCAACCCA GAAGGATTTG 
GATTTAATTG AAGTTACCCT AGGATTACCC GATCGCTGCC ATCGTCACCG ACCCGATTGG 
GTTAAAGTGG GGATTAATGG TCGGATCGTG CGATCGCCCC CGGTAGAACA GGCAATTTTA 
GTAGCATTTA GTCGAACCTT GCCTAAAGAT CGCTTTCCTG TCTGTTTTAT CCATTTAACC 
CTCTGTCCGA GTCAAATTGA TTGGAACCGT CATCCAGCCA AGGTGGAAAT TTATCTCCAT 
TCCCTCGATT TTTGGCAAGA ACAGGTGTCT AAACTGATTG AACAGGGGTT AAGGTTATCA 
CCCCAAACCC TGGCCTCTGC TGCCCAAAAT CAACGGGTAG GGAAGTTACT CAAAGCATCC 
GAAGAAAAAG CATCCTATCG CGTTGATGCT AAGGATCACC AGACTGATGC TAACGCGGTT 
GGGTTAATGC CCTTAAAGGC TGTGGCACAG GTACGCAATA CTTATATTAT GGCTGAACAT 
TCGACGGGGT TATGGTTAAT TGAACAACAT ATCGCCCATG AACGAGTGTT GTATGAAACG 
TTGCAGGATA ATTGGCAATT AATCCCGCTA GAGACTCCGA TTATTTTAAC AAAATTATCA 
GACAATCAAG TGGAACAATT AGCCAGAATT GGTTTAGAAA TTGAAGTTTT TGGAGAGCAA 
CTTTGGGCAG TTCGGACAGT TCCTAAACTG TTATCAACGA GGGAAGATTG TCCAGAGGCT 
TTAGTCGAAT TAAGCATAGG AGGAGATTTA CAAACGGCTC AAGTGGCTGT TGCTTGTCGT 
AGTGCAATTC GTAACGGAAC CCCCATGACG CTATCCCAAA TGCAGGAACT GTTAGACCAA 
TGGAAAACTA CCCGTAATCC TGCCACTTGT CCCCACGGAA GACCTATTTA TTTATCCTTA 
GAGGAGTCTT CTTTATCTCG GTTTTTCCGT CGTCATTGGG TCATTGGCAA AAGCCATGGA 
ATCTGA

Protein sequence

MSSPIQPLPL NVINLIAAGE VIDSIAAVVR ELVENALDAG ATRLVISLFP ESWRVQVADN 
GTGMTLADLR HCALPHSTSK IHQLDDLWKI TTLGFRGEAL HSLAQVADLE IASRCTSDGV 
GWCLRYQSSG EPLREEPTAI APGTIVTVGN LFGKMPVRRQ GLPAISTQLK AVQSFIENMA 
LCHPQVTWQV WHNQRLWLNI SPGKTPQQIL PQLLKGVHYH DLQFVSQGVK SPQESTQKDL 
DLIEVTLGLP DRCHRHRPDW VKVGINGRIV RSPPVEQAIL VAFSRTLPKD RFPVCFIHLT 
LCPSQIDWNR HPAKVEIYLH SLDFWQEQVS KLIEQGLRLS PQTLASAAQN QRVGKLLKAS 
EEKASYRVDA KDHQTDANAV GLMPLKAVAQ VRNTYIMAEH STGLWLIEQH IAHERVLYET 
LQDNWQLIPL ETPIILTKLS DNQVEQLARI GLEIEVFGEQ LWAVRTVPKL LSTREDCPEA 
LVELSIGGDL QTAQVAVACR SAIRNGTPMT LSQMQELLDQ WKTTRNPATC PHGRPIYLSL 
EESSLSRFFR RHWVIGKSHG I