Gene Rfer_4007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rfer_4007
Symbol
ID	3961686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodoferax ferrireducens T118
Kingdom	Bacteria
Replicon accession	NC_007908
Strand	+
Start bp	4470052
End bp	4471290
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	52%
IMG OID	637918831
Product	restriction endonuclease S subunits-like
Protein accession	YP_525236
Protein GI	89902765
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGAAC TGCTGGAAGC CTCGGTTGAA CAATTGCCAG ACGGTTGGTC ATTGGTTACT 
GTCGGCCAGC TAGTGAACGA AGGTGTGATC GCAAAGCCGC TGGATGGCAA TCACGGCGAA 
ATACATCCGA AAGGCTCTGA CTTTGTCAGT GATGGAATTC CTTTCGTAAT GGCAACGGAC 
ATCAACGCCG GGAAGGTTGA CCTGGTGAAC TGCAAGTTCA TCACTAAGAA ACAAGCTGAC 
TCGCTTGCCA AAGGTTTTGC TATTCCAGAA GATGTCTTAC TGACGCACAA GGCAACGTTG 
GGGAGAACTG CGATCGTGGG TGAATTAAGA ACCCCATACA TAATGCTAAC GCCTCAAGTG 
ACGTATTACC GGACCATTAA GAAAGACAGA CTACACAATA GGTTTCTTAA ATACTATTTT 
GATTCGCCTT TCTTTCAAGA CACTCTGGTA AATCACGGCG ATAGCGGTTC CACTCGCGCG 
TATGTGGGCA TCACCGCTCA GCGAGATTTG CCAATAATTC TTCCCAATCT TGTCAGAGAG 
CAAGAATCAA TTGCTGCGGT GCTCGCGAGT CTCGACGACA AAATCGACCT GCTGCACCGT 
CAAAACCAAA CCCTCGAAGC CATAGCCGAA ACCCTGTTCC GGCAGTGGTT TGTAGAAGAT 
GCACAAGAAG GCTGGGACGA AAGACCGCTC AGCAGCATCG CCAATTTCCT GAATGGGTTG 
GCATGCCAGA AATATCCACC AACCAATGAT CTGGAAAAAC TGCCTGTTCT CAAAATTCGC 
GAGCTAAGCA GTGGCATTTC TGAAACTGCG GACTGGGCGA CGAGTCAAGT CAAACCCGGC 
TACATCGTCG AAGCCGGTGA TGTGATTTTT GCCTGGTCCG CGTCCTTGAT GGTCAAGGTT 
TGGGATGGCG AAAAGTGTGT GCTGAACCAG CATCTGTTCA AGGTGACTTC GGACGAGTTC 
CCCAAATGGT TCTATCTGAG GTGGTGCAAG CACCATCTTG CCGAGTTCAT CGCCGTCGCT 
GCCAGCCATG CCACGACCAT GGGGCACATC AAACGCGGCG ACCTGGACGC GGCAATGGTG 
CTGGTTCCGC CACCTCCGGT TCTTGAAACC ATGTCCAGGC AGATGCAGCC ACTGCTGAAC 
AAGCAGATCG CGATTGCCCG GCAGCGCAAG ACGCTGGAGA AGCTGCGCGA CACCCTGTTG 
CCCAAGCTGA TGAGCGGTGA AGTGCGGGTC GCCTACTGA

Protein sequence

MNELLEASVE QLPDGWSLVT VGQLVNEGVI AKPLDGNHGE IHPKGSDFVS DGIPFVMATD 
INAGKVDLVN CKFITKKQAD SLAKGFAIPE DVLLTHKATL GRTAIVGELR TPYIMLTPQV 
TYYRTIKKDR LHNRFLKYYF DSPFFQDTLV NHGDSGSTRA YVGITAQRDL PIILPNLVRE 
QESIAAVLAS LDDKIDLLHR QNQTLEAIAE TLFRQWFVED AQEGWDERPL SSIANFLNGL 
ACQKYPPTND LEKLPVLKIR ELSSGISETA DWATSQVKPG YIVEAGDVIF AWSASLMVKV 
WDGEKCVLNQ HLFKVTSDEF PKWFYLRWCK HHLAEFIAVA ASHATTMGHI KRGDLDAAMV 
LVPPPPVLET MSRQMQPLLN KQIAIARQRK TLEKLRDTLL PKLMSGEVRV AY