Gene Cphamn1_2550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_2550
Symbol
ID	6376248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	2722605
End bp	2724188
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	50%
IMG OID	642685028
Product	type I restriction-modification system, M subunit
Protein accession	YP_001960925
Protein GI	189501455
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID	[TIGR00497] type I restriction system adenine methylase (hsdM)

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.19461
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGGAA AAATCGATCA GAAAGACATC AACAGCGCAG CGTGGTCGGC GTGCGACACC 
TTTCGGGGTG TGGTCGATCC GGCGCAGTAC AAAGACTACA TCCTCGTGAT GCTGTTTCTG 
AAATACATCT CTGATGTATG GCAGGACCAC TACGAAGAAT ATCAGAAGCA GTATGGCGAT 
GATGATATTC GTATCCGCCG CAAGCTCGAG CGTGAACGTT TTGTTCTCCC GGTGGTGAAA 
CTCACCGAAA AGAATGACGA AACTGGCGAG GAGGCGGTTC TGGATGAATT TCCCGCCACC 
TATTACAGTC TCTATGAACG CAGGTCCGCC GCCAACATCG GTGAATTGAT CAATATCGTT 
CTCGATCATA TTGAAGACAG TAACAAGGTC AAGCTCGAAG GTGTTTTCCG GAACATCGAT 
TTCAATAGCG AAGCAAACCT TGGCAAGACC AAGGACCGTA ACCGCCGTCT GAAACAACTG 
CTGGAAGATT TCCACAAGCC ACAGCTCAAC ATGAAGCCCA GCCTCGTGTC CGAGGATGTG 
ATCGGAAACA CCTATATCTA TCTTATCGAG CGATTCGCTT CCGATTCGGG CAAAAAAGCA 
GGGGAGTTCT TTACGCCTTT CAAGGTCAGC GAACTGGTCG CAAAGCTGGC CGATCCCAGA 
CCGGGTGACC GCATCTGTGA TCCGGCCTGT GGTTCCGGCG GTCTGTTGAT CAAGGCCGCG 
AAGGAAGTGG GTGATCGAAA TTTCGCTCTG TTCGGCCAGG AATCGAATGG TAGCACATGG 
GCACTGTGTC GCATGAACAT GTTTCTGCAC AGTTTCGACA GCGCGCGAAT CGAGTGGTGC 
GATACGCTGA ACAGTCCGTT GCTGGTTGAA AATGACCGCT TGATGAAATT CAATTGCGTC 
GTAGCCAATC CGCCCTTCTC ATTAGATAAA TGGGGTGCTG AAAATGCCGA AAGCGATCAA 
TACAACCGCT TCTGGCGCGG CGTTCCTCCG AAGAGCAAGG GGGACTGGTC TTTTATCAGT 
CATATGGTGG AAATTGCCCT CGAAAAAGAG GGCCGGGTTG CCGTTGTTGT TCCGCATGGT 
GTTCTGTTCA GAGGCGCTGC AGAGGGGCGT ATCAGACAGA AAATGATCGA AGAAAATCTG 
CTCGATGCAG TGATCGGTCT GCCCGGCAAC CTGTTTCAGA CCACTAACAT CCCTGTGGCG 
ATTCTGGTAT TCGACAGGAG CAGAGAAGGA ACCACGAAAG ACACGAAAAG CACGAAAGGT 
GAAAACAGGG ATGTTTTGTT CGTTGATGCA AGCCGGGAGT TTGTTTCAGG GAAAAACCAG 
AATACCCTTT CCGATGAGCA GATCGCGAAA ATTATGCGCA CCTACAGAGA GCGTACTGAG 
GTTGAAAAAT ATGCGCATGT CGCTGATGTT GCGGAGATAA AGGAGAACGA CTTCAATCTC 
AATATTCCTC GCTACGTCGA TACTTTTGAA GAGGAAGAGG AGATTGATAT CGACGCGGTG 
CAAGAGGAAA TTGATAATCT GGAAAAAGAG CTGGTGGAAG TCCGAAAGCA GATGGCGGAA 
AAACTTCAGC AGATTCAGAG GTAG

Protein sequence

MSGKIDQKDI NSAAWSACDT FRGVVDPAQY KDYILVMLFL KYISDVWQDH YEEYQKQYGD 
DDIRIRRKLE RERFVLPVVK LTEKNDETGE EAVLDEFPAT YYSLYERRSA ANIGELINIV 
LDHIEDSNKV KLEGVFRNID FNSEANLGKT KDRNRRLKQL LEDFHKPQLN MKPSLVSEDV 
IGNTYIYLIE RFASDSGKKA GEFFTPFKVS ELVAKLADPR PGDRICDPAC GSGGLLIKAA 
KEVGDRNFAL FGQESNGSTW ALCRMNMFLH SFDSARIEWC DTLNSPLLVE NDRLMKFNCV 
VANPPFSLDK WGAENAESDQ YNRFWRGVPP KSKGDWSFIS HMVEIALEKE GRVAVVVPHG 
VLFRGAAEGR IRQKMIEENL LDAVIGLPGN LFQTTNIPVA ILVFDRSREG TTKDTKSTKG 
ENRDVLFVDA SREFVSGKNQ NTLSDEQIAK IMRTYRERTE VEKYAHVADV AEIKENDFNL 
NIPRYVDTFE EEEEIDIDAV QEEIDNLEKE LVEVRKQMAE KLQQIQR