Gene Rpal_4667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4667
Symbol
ID	6412353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	5026595
End bp	5028082
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	66%
IMG OID	642714546
Product	two component, sigma54 specific, transcriptional regulator, Fis family
Protein accession	YP_001993633
Protein GI	192293028
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.387828
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTGAGC GTATTCTGAT CGCCGACGAC GATGCAGTGC AGCGTCGGCT GGTCGAGAAC 
ATGGTGCAGA AGTGCGGCTA TGAGGCGGTT TCGGTCGATA GCGGTGACGC TGCGGTGGAG 
GCCCTGACCG CGCCCGATGC GCCTGCGATC GACGCCGTGG TGCTCGACCT GGTGATGCCC 
GGACTCGATG GCCTCGGCGT GCTGTCGAAG ATTCGCGCCA GCGGACTCGA CGTGCCGGTG 
ATCGTGCAGA CCGCACATGG CGGCATCGAC AATGTGGTGT CGGCGATGCG TGCCGGTGCG 
CACGATTTCG TCGTTAAGCC GGTCGGCATC GAGCGCCTGC AGGTGTCCTT GCGCAACGCA 
CTGAACGCCA GCGCGATGAA GGGCGAGCTG CAGCGCATCC GCCATGCCCG CGAAGGCCGG 
CTGACATTTT CCGACATCAT CACCCGCAGC GAGGCGATGG CGCCGGTGCT GCGCGCCGCC 
GAGAAGGCTG CAGGCTCCGC GATCCCGGTG CTGATCGAAG GTGAATCCGG CGTCGGCAAG 
GAGCTGTTCG CGCGCGCCAT CCACGGCTCC AGCGACCGCC GTTCAAAACC ATTCGTGGCC 
GTGAACTGCG GCGCGATTCC CGACAATCTC GTCGAGTCGA TTCTGTTCGG CCACGAGAAG 
GGTGCGTTCA CCGGCGCCAC CGAGCGCCAC GACGGCAAGT TCGTCGAAGC CTCCGGCGGC 
ACGCTGTTTC TCGACGAGGT CAGCGAGCTG CCGCTGGCTG CGCAGGTCAA GCTGCTGCGC 
GCGCTGCAGG AAGGCGCGGT CGAAGCGGTC GGCGGACGCC GGCCGGTCAA GGTCGATGTC 
CGCATCATCT CGGCCACCAA CCGCCGGTTG CTCGACCGGG TGAAGGCGGG CCAATTCCGC 
GAAGATCTGT TCTACCGGCT GCACGTGCTG CCGCTGACGA TTCCGCCGCT GCGCACCCGC 
CGCGAAGACA TTCCGCCGCT GCTGCGGCAC TTCCTGATGC GGTTCTGCGC CGAAGAGAAG 
CGCAGCATCG GCGGCATCAC CGGCGAGGCA ATGGCACGGC TGGCGCAACT CGACTGGCCG 
GGCAATATCC GTCAGCTCGA AAATGCGGTG TATCGCGCCG TGGTAATGAG CGACGGCGAT 
CAGCTCGGCC TTGCCGACTT CCCGCTGGCG ATCGCGCCGT CGGTCGTCCC TGCAGAAGAT 
ACAACCGGCG AGCCGCTGGT GATCGAACGC AGCGAGCCAC AATTTGTCGC CGCAAGCGAA 
GTGCCGATCG CGCCGCTGCC GAGCGTCGGC AATCTGTCGA TGCTGACAGC GGACGACGAA 
GTGCGCCCCC TCGACGAAAT GGAGCGGGAG ATCATCCGGT TTGCGATCTC GCATTATCGC 
GGGCAGATGT CGGAAGTGGC GCGGCGGCTG AAGATCGGCC GCTCGACGCT GTATCGCAAA 
CTCGACGAGA TCGAAGCCGA CCGCGCCGCG CAGGCCGAGG CGCGATAA

Protein sequence

MVERILIADD DAVQRRLVEN MVQKCGYEAV SVDSGDAAVE ALTAPDAPAI DAVVLDLVMP 
GLDGLGVLSK IRASGLDVPV IVQTAHGGID NVVSAMRAGA HDFVVKPVGI ERLQVSLRNA 
LNASAMKGEL QRIRHAREGR LTFSDIITRS EAMAPVLRAA EKAAGSAIPV LIEGESGVGK 
ELFARAIHGS SDRRSKPFVA VNCGAIPDNL VESILFGHEK GAFTGATERH DGKFVEASGG 
TLFLDEVSEL PLAAQVKLLR ALQEGAVEAV GGRRPVKVDV RIISATNRRL LDRVKAGQFR 
EDLFYRLHVL PLTIPPLRTR REDIPPLLRH FLMRFCAEEK RSIGGITGEA MARLAQLDWP 
GNIRQLENAV YRAVVMSDGD QLGLADFPLA IAPSVVPAED TTGEPLVIER SEPQFVAASE 
VPIAPLPSVG NLSMLTADDE VRPLDEMERE IIRFAISHYR GQMSEVARRL KIGRSTLYRK 
LDEIEADRAA QAEAR