Gene Synpcc7942_1863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1863
Symbol
ID	3775226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	1933701
End bp	1934582
Gene Length	882 bp
Protein Length	293 aa
Translation table	11
GC content	59%
IMG OID	637800304
Product	HemK family modification methylase
Protein accession	YP_400880
Protein GI	81300672
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2890] Methylase of polypeptide chain release factors
TIGRFAM ID	[TIGR00536] HemK family putative methylases [TIGR03534] protein-(glutamine-N5) methyltransferase, release factor-specific

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACCA CTACCTGGCA GGCTGTGCTC ACTTGGCGAT CGCACCAGCA GCAACTGGCG 
CCGGATATCG ATCGCCAAGA ATTGGACTGG CTCCTCCGGG AAGTGGCCGG CGTTCCGCTA 
GAACGTCAAC GCTGGGCAGC CCCAGGCGAT CGCCTTGAGC TACGTTGCCC ACTAGCAGCG 
ATCGCGGATC TCTGGCAACA ACGGATCCGA CAGCGCTGTC CGGTGCAGTA TCTGGCAGGT 
CATGCGCCTT GGCGCGACTT GGAGTTGCAG GTTTCCCCCG CTGTCCTGAT TCCCAGGCCA 
GAAACAGAGC TGATCATCGA CCTAGCAATC GCTTGGTCCC AAGCAGAACC AGCCCGACAA 
ACAGGCTTCT GGGCGGATTT AGGGACTGGC AGCGGTGCGA TCGCGATCGC GTTAGCGCGG 
GCACTACCCC AAATCACCGT CCTTGCCGTC GATGTCAGTG CTGAGGCTCT GGCGATCGCC 
CGGAACAATG CAGCCCGCTA TGGTTTAAGC GATCGCATCC GCTGGTATCA GGGCAGTTGG 
TTGGTGCCTT TGGCCGACTA TCGAGGTCAA CTGCAGGCAA TTATCTCCAA TCCGCCCTAC 
ATTCCCACTC AAGAGTGGCA AGCCCTAGAG CCGGAAGTCC GCGATCATGA ACCGCGTCAA 
GCTCTGGAGT CTGGCCCTGA TGGGTTAGAA GCGCTACGCC ATTTAGCCCA AGCGGCGCCT 
GACTATTTGC GATCGCTCGG TCTGTGGCTC TGCGAACACA TGGCCGGTCA AAGTACCGCT 
GTAACGGCTT TGCTGGCGGC CATTCCTGGC TATTCTGAGA TCCAAAGTCA TCGCGATTTA 
GCGGGCCGCG ATCGCTTTGT TTCGGCCAGT TGGAGTGCTT GA

Protein sequence

MATTTWQAVL TWRSHQQQLA PDIDRQELDW LLREVAGVPL ERQRWAAPGD RLELRCPLAA 
IADLWQQRIR QRCPVQYLAG HAPWRDLELQ VSPAVLIPRP ETELIIDLAI AWSQAEPARQ 
TGFWADLGTG SGAIAIALAR ALPQITVLAV DVSAEALAIA RNNAARYGLS DRIRWYQGSW 
LVPLADYRGQ LQAIISNPPY IPTQEWQALE PEVRDHEPRQ ALESGPDGLE ALRHLAQAAP 
DYLRSLGLWL CEHMAGQSTA VTALLAAIPG YSEIQSHRDL AGRDRFVSAS WSA