Gene RPB_4400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4400
Symbol
ID	3912215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4984989
End bp	4986041
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	72%
IMG OID	637886305
Product	putative FecR
Protein accession	YP_487997
Protein GI	86751501
COG category	[P] Inorganic ion transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG3712] Fe2+-dicitrate sensor, membrane component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0568232
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.23003
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGCGTG GAAGAGCGGC GCTTGCCATA ACAGCAGACG CTTTTGCGAG AGAATGCGCG 
GCGATGGAAT TCGCATCCGA CGACAGCAAG GACCGGGAGC GGGCGTCGCG AGAGGCGACC 
GAGTGGTTCG TGCGTCTGCA GAACCCCCTC GCCACCGACG ACACGCGGCG GGCTTACCGG 
GATTGGCTGA TGGCCGACCC CGCGCATCGC GAAGCGATCC GCGACGTCTC CGAATTGTGG 
GGCGCGCTCG ATCGGCCCGC CGCGCAGCTC GCCAGCACCG GCTGGCACCG CTCCGCCGAC 
GAACCGGCAC CCCGGCCGCG CCGATGGTTC GCGACGGGAT CGAGGTTCGC GACCGCCGCC 
GTCGTCGTCG TCGCGCTGGC GGGCGGCCTT GCCGTGTGGC GCGATCCAGG GCTGCTCGAC 
CGGGCTTTCG CCGATGTCGC GACGCATCCC GGCGAGCGGC GCGAAGTGAG TCTCGCCGAC 
GGGACGCTTG CTGTTCTCGA TGGCGACACG GCCCTCAAGA GCCACATGAG CGGCCCCCGC 
CGCGACGTGA CCGTGTTGCG CGGCCGGGTC TGGCTCGATG TGGCCCGCGA TCCAGCGCGG 
CCGTTCACGG TGCATGCCGG AGGCGTCGAT GCCCGGGTGC TCGGCACCGC CTTCGAGGTC 
AATCGCGAGG CCGCCGCGGT CACCGTCGAG CGCGGCGAGG TCGCGGTGTC CGGCGTCGAC 
AGTCGGCTCG GCCCGGTCAA GCTGACGGCC TGGCAGCGCG TTGCGCTTCA GGACGGCACG 
CTGGGCGCGC CGGTCACGGT CGACCCGGAG CAGATGTTCG CGTGGCGGCG GGGGCTGATC 
ATTCTCGATC GTGCGCCGCT GTCGCAGGTC GTCGAAGAAC TCGACAAAAT GGCGCCCGGC 
CGCGTGCTGA TCGCCGATCC GGAGCTGAAG CGCCTGACGC TCTCCGGCGC CTTTCGCACC 
GACGAGCCCG GCGCCGTGCT GGAAGCCCTG CGGAGCGCGC TCGGGCTCCG CACCGTCTCC 
GTCCCGGGCT TCGCGACGCT GATCTACCGC TGA

Protein sequence

MRRGRAALAI TADAFARECA AMEFASDDSK DRERASREAT EWFVRLQNPL ATDDTRRAYR 
DWLMADPAHR EAIRDVSELW GALDRPAAQL ASTGWHRSAD EPAPRPRRWF ATGSRFATAA 
VVVVALAGGL AVWRDPGLLD RAFADVATHP GERREVSLAD GTLAVLDGDT ALKSHMSGPR 
RDVTVLRGRV WLDVARDPAR PFTVHAGGVD ARVLGTAFEV NREAAAVTVE RGEVAVSGVD 
SRLGPVKLTA WQRVALQDGT LGAPVTVDPE QMFAWRRGLI ILDRAPLSQV VEELDKMAPG 
RVLIADPELK RLTLSGAFRT DEPGAVLEAL RSALGLRTVS VPGFATLIYR