Gene Rfer_4029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rfer_4029
Symbol
ID	3961708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodoferax ferrireducens T118
Kingdom	Bacteria
Replicon accession	NC_007908
Strand	-
Start bp	4492068
End bp	4493183
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	64%
IMG OID	637918853
Product	putative DNA alkylation repair enzyme
Protein accession	YP_525258
Protein GI	89902787
COG category	[L] Replication, recombination and repair
COG ID	[COG4335] DNA alkylation repair enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAAG CCCTCAAAAA CCAGTTTGGC GCCGATGTGC CGCGTGCGAT TGCCGCCATG 
ATCTCGGCGG TGCACCCGTC TTTCAACCGC ACGGCTTTTG TGAGCGACGT GCTGGACGGG 
TACGACGCGC TGGCGCTGAT GCCGCGGGGA AAAAAAATAG CCCAGGCCTT GCGTCGCCAT 
TTGCCAGACG ACTATGCGCA CGCGCTTGCC ATCCTGCTGG ACTCGCTGGA TCAAGCCCAT 
GGCCGCGACC CCGGCCAGAG CCTGGCCTCG TTTCTGTACC TGCCGCACAC CCAGTTTGTG 
GCTGAGTTCG GCCTGGCCCA CTTCGAGCTG TCGATGCGGG CACAACATGC CTTGACGCAA 
CGCTTCACGG CCGAGTTCAG CATCCGCCCG TTCATCGAAC ACCACCCTGA AGCCACCTTG 
CGTCAGCTTC AGGCATGGGC ATGCGACCCC AGTGCACACG TTCGCCGGCT GGTGTCCGAA 
GGCACGCGCC CCCGGCTGCC CTGGGCACCG CGTCTGCGCC GGTTTCAGGC CGACCCGGCG 
CCGGTATTGG CGCTGCTGGA GCTGCTCAAG GATGACCCCG AGTTGTATGT GCGGCGTTCG 
GTCGCCAACA ACCTGAACGA CATTGGCAAG GACCACCCGG ACGTTCTGGT CCACACGGCC 
CAGGCCTGGC TCCAGGGTGC CAGTGCGCAG CGCGCATGGA TCGTTGGCCA TGCCTTGAGG 
TCCGCCGTCA AACGGGGCGA AAGCGGCGCG CTGCAGGTGC TGGGGTTTGG CCAGACGCCC 
CGCGTGAGCG TGACCAAGGT CCAGATCAGC CCCCGCCTTG CCGTGACCGG TGGCACCGTG 
CAGATTGAGT TTGACGTGAC CAACTGCCAC ACCTCAGCAC AAAGCGTGTT GGTGGACTTT 
TGCGTGCATT ACGTCAAGGC CAACGGCCAG ACCCGCGCCA AGGTGTTCAA GCTCAAAACC 
CTGCAACGGG CACCCGGCCA GACCGCGCCG CTGGCCAAAA AACTGTCGCT GGCGCAGATG 
AGCACCCGCA GACACTACCC GGGGCTCCAC AAGCTGGACG TGATGCTGAA TGGCCAAGCC 
CAGCCGCTGG GCGCATTCGA GTTGCTGCAA GCCTGA

Protein sequence

MAEALKNQFG ADVPRAIAAM ISAVHPSFNR TAFVSDVLDG YDALALMPRG KKIAQALRRH 
LPDDYAHALA ILLDSLDQAH GRDPGQSLAS FLYLPHTQFV AEFGLAHFEL SMRAQHALTQ 
RFTAEFSIRP FIEHHPEATL RQLQAWACDP SAHVRRLVSE GTRPRLPWAP RLRRFQADPA 
PVLALLELLK DDPELYVRRS VANNLNDIGK DHPDVLVHTA QAWLQGASAQ RAWIVGHALR 
SAVKRGESGA LQVLGFGQTP RVSVTKVQIS PRLAVTGGTV QIEFDVTNCH TSAQSVLVDF 
CVHYVKANGQ TRAKVFKLKT LQRAPGQTAP LAKKLSLAQM STRRHYPGLH KLDVMLNGQA 
QPLGAFELLQ A