Gene Acid345_4471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4471
Symbol
ID	4070954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5305801
End bp	5306643
Gene Length	843 bp
Protein Length	280 aa
Translation table	11
GC content	61%
IMG OID	637986510
Product	HemK family modification methylase
Protein accession	YP_593545
Protein GI	94971497
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2890] Methylase of polypeptide chain release factors
TIGRFAM ID	[TIGR00536] HemK family putative methylases [TIGR03534] protein-(glutamine-N5) methyltransferase, release factor-specific

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.44182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTCA AGCAAGCCTT CGACTCCGCA CTTAAGCATT TAGAAGCAGC CGACACTCCT 
TCCCCTCGCC TGAGCGCCGA GCTCTTGCTG ATGTTCAGTT TGAATTGCGA TCGCGCTTAT 
CTCTTTACCT ATCCCGAGCG CGAACTCACC GCCGACGAAC AGGCCCGCTA CGACGAAGCC 
ATCGCCCGCC GCTGTCATGG CGAGCCCGCG CAATACATCA CCGGACACCA GGAGTTCTAT 
GGTCGCGACT TCCTCGTCTC GCCGGCGGTG CTCATCCCGC GCCCTGAAAC CGAGCACCTG 
ATCGAAGCCG TGCTCGAACT CGCGCCACGC GAGGTGCGTT GGGAAGTCCT CGATGTTGGA 
ACCGGCTCCG GCTGCATTGC CGCAACGCTT GCCAAAGAAT TTCCGCGGAT GAAAGTCACG 
GCCGTCGATA TCTCGCCCGA AGCGCTCCAG ATTGCACAAG CCAATGCCGC CCGCCTCGAA 
GCTCAAGTCG AGTTTCGTGT GAGCGATCTA CTCAGCGCGA TCGAACCCGG ACGCCAGTTC 
GACATGATCG TCTCCAACCC GCCCTACGTC GGCGAGTGCG AGGCTGACAA AGTCCAGCGC 
CAGGTGAAAG ACTTCGAGCC GCACTGCGCC GTCTTCGGCG GCGAGCGCGG CATGGACATC 
ATCAAGCGTC TGGCGCCGCA GGTTTGGGAG CACCTCAAAC CGGGCGGCTG GTTCCTAATG 
GAAATCGGGT ACTCCATCGC CGATCCCGTC CACGAAATCA TGCGCGACTG GACCAACTTC 
AAGGTCGTCC CCGACTTGCG AGGCATCCCG CGCGTTGTCG TCGGCCGCAA ACCAACTTCT 
TAA

Protein sequence

MTLKQAFDSA LKHLEAADTP SPRLSAELLL MFSLNCDRAY LFTYPERELT ADEQARYDEA 
IARRCHGEPA QYITGHQEFY GRDFLVSPAV LIPRPETEHL IEAVLELAPR EVRWEVLDVG 
TGSGCIAATL AKEFPRMKVT AVDISPEALQ IAQANAARLE AQVEFRVSDL LSAIEPGRQF 
DMIVSNPPYV GECEADKVQR QVKDFEPHCA VFGGERGMDI IKRLAPQVWE HLKPGGWFLM 
EIGYSIADPV HEIMRDWTNF KVVPDLRGIP RVVVGRKPTS