Gene Rfer_4041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rfer_4041
Symbol
ID	3961720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodoferax ferrireducens T118
Kingdom	Bacteria
Replicon accession	NC_007908
Strand	+
Start bp	4506899
End bp	4508545
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	69%
IMG OID	637918865
Product	peptidase M48, Ste24p
Protein accession	YP_525270
Protein GI	89902799
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCCCCG TCAACAAAGC GTTGTTAGCT ATCGTTATAG TAGCTTTTGG CATGACCGAC 
CTGAGCCCGG CACGCGCCCA GTCCACGGGT GCCCAGATCC CGACACTGGG CGACACCAGC 
GACATGAGCA GCAGCAACGA GCGCCGCCTG GGGGATCGCA TCGCGCGTGA AATCTACCGC 
GACCCGGACT ACCTGGACGA CCCGGTGCTG GCCGAGTACG TGCAGGGCGT CTGGCAACCG 
CTGCTGGCGG CGGCGCGCGC GCGTGGCGAC CTGTCGCCCG AACTGGCCGA GCGTTTTGCC 
TGGGAGGTCA TGCTGGGCCG CGACCGCACG GTCAACGCCT TTGCCCTGCC GGGCGGCTAC 
CTGGGTGTGC ACCTGGGGCT GATTGCCGTG GTCAGCAACC GCGACGAACT GGCCTCGGTC 
CTGGGGCACG AACTCAGCCA CGTCACGCAG CGCCATATTT CGCGCCTGAT GGCCAAGCAG 
GGGCAAATGG CACCCTGGAT GATTGGCGCC ATGGTGCTGG GTGCACTGGC GGCGGGCAAA 
AGTGCCGATG CCGGCAATGC GCTGATCGTG GGCGGTCAGG CGGTGGCGGC GCAAAACCAG 
CTCAATTTCT CGCGCGACAT GGAGCGCGAG GCCGACCGCG TGGGCTTTGG CATCATGACC 
GAGGCCGGCT TCAAAGGGCA GGGCTTTGTC ACGATGTTTG ACAAGCTGCA ACAGGCCTCG 
CGCCTCACCG ACAACGGCGC CTACCCTTAC CTGCGCAGCC ACCCGCTCAC GACCGAGCGC 
ATCGCCGACA TGCAGGCGCG GCAGGGCCTG GCTGCGCCAG GGCCGGTCAA AGCCACGCTA 
ACGCTGGAGC ACGCCCTGGT GGCGGCGCGC GCCCGGGTGC TGTCCAACGC CGACGTCGAC 
GCGCTGCGGA CTTGGCAGGC CGAGGCTGGC AGTGCCGGCC TGAGCACCCA GGCTGCGCCC 
CGGCAGGCGG GCGTCTGGTA CGGCGCCGCG CTGGCCGCCA GCCAGTTGCG CGACTTTGCC 
CAGGCACGCA TCGACCTGGA GCACTTGCGT GGCTTGGTGA CGGGCGATGC CAGCGCGACG 
CGCCTGGCGC GGCTGCTGCA GGCCGAAATC GCCTTGCGCG CGGGTGATGC CGCCGGCGCG 
CAAACCGCCT TGAACACCAT CCTCACCGCA GCGGCCGCGC CCGGTGCGGT CACCGCGCAG 
GATCAGGCAT CGACCACGCG GCGCCCGGAA CTGCTGCTGG CGGCGCAGAT CGCCCTGCAG 
GCGGGCCCGG CTGGGCAGAC TGACCCGGCT GGCGGCAGCG CCACGATCGC GGCTGTCGCG 
GTGCGCCTGC AAACCTGGGT CACGGTCCAT CCGCACGATG CGCAGGCCTG GCAGCTGCTG 
TCAAGTCTGC AGGGCGCGCA GCACCAGACC CTGCGCGCCC TGCGTGCGGA CGCCGAAGCC 
CAGGTGGCAC GGCTGGATTA CGCGGCGGCG GTGGACCGCT TCAAGGCGGC GCAGGCGTTT 
TCACACCAGC AGCACAGCGG TCAGGGACAA GCGAACGGGG GCGCCAGCCC GAGCCAGGCA 
GCGGCCGACC ACATCGACGA GTCCATCATC GACACGCGCC AACGGCAGGT GCAATCACTG 
CTTAAAGAAC AGACGCTCGA TCGCTGA

Protein sequence

MAPVNKALLA IVIVAFGMTD LSPARAQSTG AQIPTLGDTS DMSSSNERRL GDRIAREIYR 
DPDYLDDPVL AEYVQGVWQP LLAAARARGD LSPELAERFA WEVMLGRDRT VNAFALPGGY 
LGVHLGLIAV VSNRDELASV LGHELSHVTQ RHISRLMAKQ GQMAPWMIGA MVLGALAAGK 
SADAGNALIV GGQAVAAQNQ LNFSRDMERE ADRVGFGIMT EAGFKGQGFV TMFDKLQQAS 
RLTDNGAYPY LRSHPLTTER IADMQARQGL AAPGPVKATL TLEHALVAAR ARVLSNADVD 
ALRTWQAEAG SAGLSTQAAP RQAGVWYGAA LAASQLRDFA QARIDLEHLR GLVTGDASAT 
RLARLLQAEI ALRAGDAAGA QTALNTILTA AAAPGAVTAQ DQASTTRRPE LLLAAQIALQ 
AGPAGQTDPA GGSATIAAVA VRLQTWVTVH PHDAQAWQLL SSLQGAQHQT LRALRADAEA 
QVARLDYAAA VDRFKAAQAF SHQQHSGQGQ ANGGASPSQA AADHIDESII DTRQRQVQSL 
LKEQTLDR