Gene Rcas_1074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1074
Symbol
ID	5538540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1391791
End bp	1393443
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	48%
IMG OID	640893210
Product	modification methylase NspV
Protein accession	YP_001431193
Protein GI	156741064
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.77087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGATC AAAAACAACG CAAAGCCGAA TTTGGAGATT TTCAAACGCC CATCAGATTA 
GCCAGGGAAG TATGTTCTCT CATTGCTCGG ACCGGTTTTC GTCCCGCTTC GATTCTCGAA 
CCAACATGTG GGACGGGTTC ATTTCTCAAA GCATCTCTCG AAACATTCCC AGATGTATCG 
CGTGTTCTTG GCTTTGAGAT CAATCCGCAC CACGTGTTGC AAGCGCAGTA TGCTGTCGCA 
CCCGCATTTC CTCATGCGTC TATTGAAGTT CATCAGTCTG ATTTCTTTCT CACGAGTTGG 
TCTGAGATTG TTAAAGCGTT GCCTGAGCCC ATTCTTGTTA TCGGCAATCC ACCCTGGGTG 
ACGAATGCAG CGTTGAGCAC TTGGGGCAGT AGCAATGTTC CGATGAAATC AAACCTCGAC 
AATCTCCCTG GTATTGATGC GCTCACCGGC AAAAGTAATT TCGACATTTC GGAATGGATG 
CTTAGAAAGA ACATCGAATG GCTTAATGGC AAGAACGGCT TACTTGCAAT GCTTTGTAAA 
ACGACAGTAG CACGTAAAGT TCTCTTGTAC GCTTGGCAAA ACGGGCTGCG GATCGAGTCG 
GCATCACTTT ATATCCTGGA TGCGCGGGAA TACTTTAGAG CTTCAGTTGA CGCTTGCCTT 
CTGGTAGTTC GCAGCAATTC GACCGGCAAC AGCAAAGAAT GCCAGGTTTT TCCTTCTCTT 
CATGCACAAC AGCCCCATAG CTTATTCGGT TTGCAGGATG GAATGCTTGT GGCTGATGTC 
AAATCATACC TGAAACGGAA AGACCTCACA GGGACAGGCT TTAGGGGCTG GCGGTCAGGA 
ATAAAGCATG ATTGCAGCAA CGTCTTTGAG CTGCGCATTG AGTGTGGGAA TCTTGTTAAT 
GGCCTGGGAG AATTCGTTGA TATTGAACCC GAAGTGCTCT TTCCTCTGCT CAAAAGTTCT 
GATCTCGCAG CGCATAGGAA GCCGCATCGG TGGATGCTTG TTCCTCAACG GGCAATGAGT 
GACGACCCGA GCCGTCTTAG GTTGGACGCT CCCAAGGCCT GGAATTACCT TACTGCCCAT 
GCACATCTTT TGGACGAACG AAAGAGTTCA ATATACAGGA ACCGTCCGCG CTTCTCAGTC 
TTTGGAGTTG GACCATATTC ATTTGCTCCC TGGAAGATTG CTCTTTCGGG TTTATACAAG 
AAACTTGAGT TTGTTCAAGT TCCACCGTTT CTGGAACGCC CGGTGGTTTT CGATGACACA 
TGTTATTTTT TCCCATGTCA GTCTGAAGAA GAATGCAACC TATTGTACGA ATTGGTCACA 
TCCGAACCTG CCAGAGAGTT CTGGTCTGCA TTCATTTTCT GGGATGCAAA GCGGCCAATT 
ACGGCACAAC TTCTTAATTC ACTTGATCTG ATGGCTCTTG CACGCCTTTT GGGTAAGGAA 
TGTGATAGAG TACGGACTCT TGCAGAAAGA CAGATTGTAG AATATACGGA AGGGGTCTTC 
CAGAGACTCC TTTTCAGAGA AGAAACTGCT GACTATGAGA GTGATCTCGT TGCAAACGAA 
TTAGATTTGC CAGCCGCCCA ACACGCGCTT CCAGCCGACG CCGCTTCACT GCTCCTTCGC 
TTCGCTCAGG GCAAGGCCTC GCGGCGCGGT TGA

Protein sequence

MRDQKQRKAE FGDFQTPIRL AREVCSLIAR TGFRPASILE PTCGTGSFLK ASLETFPDVS 
RVLGFEINPH HVLQAQYAVA PAFPHASIEV HQSDFFLTSW SEIVKALPEP ILVIGNPPWV 
TNAALSTWGS SNVPMKSNLD NLPGIDALTG KSNFDISEWM LRKNIEWLNG KNGLLAMLCK 
TTVARKVLLY AWQNGLRIES ASLYILDARE YFRASVDACL LVVRSNSTGN SKECQVFPSL 
HAQQPHSLFG LQDGMLVADV KSYLKRKDLT GTGFRGWRSG IKHDCSNVFE LRIECGNLVN 
GLGEFVDIEP EVLFPLLKSS DLAAHRKPHR WMLVPQRAMS DDPSRLRLDA PKAWNYLTAH 
AHLLDERKSS IYRNRPRFSV FGVGPYSFAP WKIALSGLYK KLEFVQVPPF LERPVVFDDT 
CYFFPCQSEE ECNLLYELVT SEPAREFWSA FIFWDAKRPI TAQLLNSLDL MALARLLGKE 
CDRVRTLAER QIVEYTEGVF QRLLFREETA DYESDLVANE LDLPAAQHAL PADAASLLLR 
FAQGKASRRG