Gene Rfer_2050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rfer_2050
Symbol
ID	3962097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodoferax ferrireducens T118
Kingdom	Bacteria
Replicon accession	NC_007908
Strand	+
Start bp	2218559
End bp	2219584
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	61%
IMG OID	637916870
Product	AraC family transcriptional regulator
Protein accession	YP_523306
Protein GI	89900835
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.105826
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCAATC CGAGCCCCAC CATCCCGATG TCATTTGTTC AGAATCTGCT GATGGGCGCC 
ACGCGGATGC TGGCGCCTGA AGCGATTGAT GAGCTGCTTC GTCAGGCCGG TATTGCGCCC 
ACGCTCCTCC CGCAGCGCGG CGCCCGCGCG ACGCGTGAAC AGTTCGTGCG GCTTTACCAG 
ATCACTGCTT TGAGCATTGG CGACGAGATG CTCGGCCTTT GGTCGCGGCC GATCCGCGCC 
GGCACACTCA AGTACCTGGG CCTGAGCCTG CTCGATGCGC CCTCGGTATG GGTTGCCATG 
TACCGGTTCA CGCGGTTCTG GAACCTGCTG CTCGACGACT ACGCGCTGCA ACTGTCACGC 
CAGAACCAGT GTGTGACCAT TGCGCTCAAG CCGCTGGGCG CACTGACCAC ACCAACGATC 
TTTGGGCATG AGCTGATGGT CAAACTCATC CACGGCGTTG CCTCTTGGCT GGTGGGGCGC 
GAGTTGCCGA TTGAGACGCT TGGTTTCGGC TTTGCACGTC CCGCGCACTT TGCCGAGTAC 
GCCCAACTAT TTCCGGGTCC GGTGAGCTTT GATCAAAGCT GCACATCGGT CAGCTTTGCC 
GAGCAGGTGT TGCGGCAACC CTTTCATCGC ACCAAAATCG AGTTGGTCAA GTTCGTCAAA 
CGTGCGCCCG ATGATTGGCT ATTTGTGACT TTCGATCACG GCCCGACCAG TACCCGCGTG 
CGGGAATACC TCCTGGCCCA TTCCGGTGCC GATCAGTCAT TGGATGCGGT GGCCGCAGCA 
CTCTTCATGT CGGGTCGCTC CCTGTCCAGA GGGCTCGCCC TTGAGGGGGG CACATTTCAG 
AGAATCAAAG ATGAGATGCG TCGTGACCTG GCGATTGAAC GCCTGGTCAC GACGCGCGAA 
TCCATTGACC GGATTGCCGC GCTGGCCGGC TTCGACAACA CACCCGCGTT CCATCGTGCC 
TTCAGGGCCT GGACCGGCAG CACGCCTGGG GCCTACCGGC GACCAGCGGT GATTCCTTCT 
GCGTGA

Protein sequence

MRNPSPTIPM SFVQNLLMGA TRMLAPEAID ELLRQAGIAP TLLPQRGARA TREQFVRLYQ 
ITALSIGDEM LGLWSRPIRA GTLKYLGLSL LDAPSVWVAM YRFTRFWNLL LDDYALQLSR 
QNQCVTIALK PLGALTTPTI FGHELMVKLI HGVASWLVGR ELPIETLGFG FARPAHFAEY 
AQLFPGPVSF DQSCTSVSFA EQVLRQPFHR TKIELVKFVK RAPDDWLFVT FDHGPTSTRV 
REYLLAHSGA DQSLDAVAAA LFMSGRSLSR GLALEGGTFQ RIKDEMRRDL AIERLVTTRE 
SIDRIAALAG FDNTPAFHRA FRAWTGSTPG AYRRPAVIPS A