Gene Rcas_2231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2231
Symbol
ID	5539712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2879315
End bp	2880424
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	45%
IMG OID	640894364
Product	DNA methylase N-4/N-6 domain-containing protein
Protein accession	YP_001432332
Protein GI	156742203
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0921492
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.000652955
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCACTAC CTTTAAATCA GATTATTGAA GGTGATTGTG TGGAAATACT GAATACGTTA 
CCAGAAACAT CCATTGACCT TATTTTTGCC GATCCTCCCT ATCATTTACA GTTACAAAAC 
GAACTTCATC GACCAAATAT GACGAAAGTG GACGCTGTCG ATGACGACTG GGACAAGTTC 
GAGTCGATGC AAGCGTATGA TGAATTTACT CGAACGTGGT TAACGGCGTG TAAGCGGGTC 
TTGAAACCAA CCGGCACCAT CTGGGTTATC GGAACGTACC ATAATATCTT TCGTGTTGGG 
GCCATGATGC AGGATTTAGG GTTCTGGATC CTCAATGATG TTATCTGGAT AAAACTAAAT 
CCGATGCCTA ATTTTCGTGG TGTCCGTTTT ACCAATGCCC ATGAAACCCT CATTTGGGCA 
AGTACCGGTA AAGATGCAAC ATATACGTTC AACTATTACG CGATGAAAGG GTTGAACGAT 
GAAAAGCAAA TGCGTTCTGA CTGGTGGCTT TTACCGTTAG CGACGGGATC GGAACGGGTA 
AAAAATGAAC ATGGCGATAA AGCCCATTCC ACCCAGAAGC CGGAGGCGTT ACTGTATCGG 
GTGATTTTGT CATCCAGCAA TCCCGGTGAT GTGGTGCTTG ACCCATTTTT TGGAAGTGGA 
ACAACGGGTG TTGTCGCGAA ACGTTTGCAT CGAAATTGGA TTGGAATAGA AAAGGAGAAA 
CGATATGTCC AGATTGCGCA AAAGCGCATT GACGCAATGC AGCCAGAGAT GTTTGACGCT 
GCGACGTTTG ATGTAAAGAG CAAAGCCAAA TCTGCTCCTA AAGTGGAGTT TTCGGTTCTG 
GTCGAACATG GGTATGTACA ACCTGGGCAA CGATTGTTTT TTGGAAAAGA CAAAACGAAA 
GTGGCCACAA TCAAGCCTGA TGCTCGGCTC CGTACTGCGG ACGGCTTCGA AGGCAGCATC 
CATCAGGCAG GTAGCCATTA CATGAACAAT GCGCCCTGTA ATGGGTGGGA GCATTGGTTT 
ATCGAAGTTG ATGGTCAAAT GATCAGTCTT GACGAAGTGA GAGAAAAGTT TCGGGTAGAC 
AAGGGGCTTT ACAATGAACG ATCAGGTTAA

Protein sequence

MPLPLNQIIE GDCVEILNTL PETSIDLIFA DPPYHLQLQN ELHRPNMTKV DAVDDDWDKF 
ESMQAYDEFT RTWLTACKRV LKPTGTIWVI GTYHNIFRVG AMMQDLGFWI LNDVIWIKLN 
PMPNFRGVRF TNAHETLIWA STGKDATYTF NYYAMKGLND EKQMRSDWWL LPLATGSERV 
KNEHGDKAHS TQKPEALLYR VILSSSNPGD VVLDPFFGSG TTGVVAKRLH RNWIGIEKEK 
RYVQIAQKRI DAMQPEMFDA ATFDVKSKAK SAPKVEFSVL VEHGYVQPGQ RLFFGKDKTK 
VATIKPDARL RTADGFEGSI HQAGSHYMNN APCNGWEHWF IEVDGQMISL DEVREKFRVD 
KGLYNERSG