Gene Noc_1585 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1585
Symbol
ID	3705747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1765038
End bp	1766681
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	42%
IMG OID	637738065
Product	DNA mismatch repair protein MutS-like
Protein accession	YP_343594
Protein GI	77165069
COG category	[L] Replication, recombination and repair
COG ID	[COG0249] Mismatch repair ATPase (MutS family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAGTT CCTTGAAAGA ATACCTAAGA GAAATGATAC ATGGAATATA CCCGCCTATT 
TTGCAAGGAA GTGAGGCTGC GCCATCGCCC CATTCAACGC AACCGTCCCG TGTTGGAGAA 
GGGGTGATTG ATGAATCCAC CTTCCAGGTG ATAGAAGCGG ATAGGCTTTT CGATGCGATA 
AATACCGCCC ATACAGTGAT AGGCCAGGCC GTGCTTTATC GCTCTTTGGC CCAGCCGTTA 
GCTGACATAA AAATCATCAA GGCCAAGCAA GAAGCATTAC AGGAGCTGGC GTCGAACCCT 
AGCCTTCGGG AAAAAATAGA ATCATTGACA AAAAAAGCTT CTAAACGGGA AAAGTCATTT 
TACCGTTTAC TTTTTAGTAA ATTTACCGGT TTTTTTGGCA GTTCGAGAGG GGATACTGAA 
ATTGAGGGAT ATGGCTATGC TACTTATGAA AGGGGAACAA CTTTTATGCT CGAACTGGTT 
AAGGATGCAA GGACTTTGCC TGCGCCAGAG AGTAATTATC TCAGAATTCT AATTGATGAT 
CTCAAGGGGT TCGGCGCTAC TAAAATTCAT TCTTTGATGA AAGGACCCGT TTATTTAACA 
GAGAGTGGAA TTAGGACGAG AGAAGAAAAA AAATGGTTTA TTCCTGCTGT AAAATTCAGG 
CCAACTTTGT TTAAACCACT TTTTATACTG GCAGTATTGC TGGGAATTGT TGCGCTCTTT 
ATGTATGGGC CTATGGTGCT GGGTATCTCT TTTTCTTCCT CGCCCATACT GATACTTTTT 
CTCCTGCCAG CCCTCATATT TTATATGCCT ATGGTGGGTA CATTTGACCG TGACAGTTGC 
ATCTATCCTT TGCAGAAACG CTACCAAGAA TCGGAAGACG TACATACTGC GCTGGAAGCT 
TTGGGAAAGT TGGATGAATT GCTTGCCTTT CATCATTATG GGAAATCGTT TGGTAGCCCT 
ACAGTACTGC CACGAGTTAT TGCGGCAAAA AATCATACCC TGATACTCAG GGAGGCGAAA 
AATCCTATCC TGGGTAAGGA TAACCCTAAT TATGTTCCCA ATGATATTGA CCTGGATGGC 
CAAAAGCTCA CCTTTATTAG CGGTCCCAAT AGCGGCGGCA AAACGGCCTT TTGCAAAACA 
ATCGCTCAAA TTCAATTGCT CTCCCAAGTA GGCTGTTATG TGCCCGCGGA AGATGCTGAA 
ATTTCTGTTG CTGATCGTGT TTTTTACCAA GTCCCTGAAA TTAGCTCCTT GGAAGATGTA 
GAAGGGCGGT TTGGAAAAGA ACTTAAGAGA ACCAAGGATA TGTTTTTAAT GACGAGCCCA 
GAGAGCTTGA TAATTTTAGA TGAATTATCG GAAGGGACGA CTCACGCAGA AAAATTGGAG 
ACCTCTTTCC ATGTACTCAA CGGGTTTTAT CGAATAGGAA ATAATACGCT TTTAGTGACC 
CATAACCATG AGCTGGCGGA ACGATTTAAA GAAAATAAAA TAGGTCAGTA TTTTCAGGTT 
CAGTTTATAG GAGAAGGACC CACCTACAAA ATTATTGAAG GGATATCAAA AGTAAGCCAT 
GCGGATAGAG TCGCCAGAAA AATAGGATTT GGGAAGGAAG ATATAGAAAG GTATTTAAAG 
GAAAAGGGGT TTGTTAGCGG GTAG

Protein sequence

MSSSLKEYLR EMIHGIYPPI LQGSEAAPSP HSTQPSRVGE GVIDESTFQV IEADRLFDAI 
NTAHTVIGQA VLYRSLAQPL ADIKIIKAKQ EALQELASNP SLREKIESLT KKASKREKSF 
YRLLFSKFTG FFGSSRGDTE IEGYGYATYE RGTTFMLELV KDARTLPAPE SNYLRILIDD 
LKGFGATKIH SLMKGPVYLT ESGIRTREEK KWFIPAVKFR PTLFKPLFIL AVLLGIVALF 
MYGPMVLGIS FSSSPILILF LLPALIFYMP MVGTFDRDSC IYPLQKRYQE SEDVHTALEA 
LGKLDELLAF HHYGKSFGSP TVLPRVIAAK NHTLILREAK NPILGKDNPN YVPNDIDLDG 
QKLTFISGPN SGGKTAFCKT IAQIQLLSQV GCYVPAEDAE ISVADRVFYQ VPEISSLEDV 
EGRFGKELKR TKDMFLMTSP ESLIILDELS EGTTHAEKLE TSFHVLNGFY RIGNNTLLVT 
HNHELAERFK ENKIGQYFQV QFIGEGPTYK IIEGISKVSH ADRVARKIGF GKEDIERYLK 
EKGFVSG