Gene RPB_2053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2053
Symbol
ID	3909868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	2333748
End bp	2335742
Gene Length	1995 bp
Protein Length	664 aa
Translation table	11
GC content	68%
IMG OID	637883946
Product	Fis family transcriptional regulator
Protein accession	YP_485671
Protein GI	86749175
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTACGAA ATCTCGTAGT ATACGATTTT TCGGAGTCGA ATTACGAGAT CTCGGAGCAA 
GTGGTGGATC TGCCGGTACC CTTTTCCGCA ACCGACACCG ATCTGCGCGC GGAGGCCTTC 
GACGGGCTGA TCGAGGCGGC GCTGTTGCTC GATCCGGCCG CCGACCAGAT CCTCGAGGTC 
AATCCCGCGG CCTGCGCCCT GCTCGGCTAC GACCGCGCCA CGTTGCTGCA GACCCGGATC 
AGCGCGCTGC ACGACCGGCA ATTCCCGGCG CTGATCGTAT TCACCCAGGC GGTGTTCGAC 
CGCGGCAGCT ATTGGACCCA CGCGCTGACG CCGAACCATG GCGCCGGCAC GCCATTGCGG 
GTCGAATATG CCGGCCGGGC GCTGCAATCT CGCGGGCGCA CACTGCTGCT GCTGACGATG 
AGCGACCTCG AGCAGCGCCG CCGCCGCCAT ATCGACGCAG CGGCCGACGA TTACATGCGC 
GACGGACTGC CGGCGTGGCA GCGGGTCGAG CGGGTGTTCG AGGATATCGA GCGCGAGAAC 
CAGTTGATCC TGCGCGCTGC CGGCGAAGGC ATCTACGGCG TCAACGCCGA GGGCCGCGCC 
ACCTTCGTCA ACCCGGCGGC GGAACGGATG CTCGGCTGGT CGGCCGAGGA GCTGGTCGGT 
CGGTCGATCC ACGCCGTGAT GCACCACACC CATCACGACG GCCGTCCCTA CGCCGACCAC 
GACTGCCCGA TCTACGCCGC GTTCCGCGAC GGCGCGGTGC ACACCGTCGA CGGCGAAGTG 
TTCTGGCGCA AGGACGGCAA GCCGGTGTGG GTCGAGTACA CCTCGACGCC GATCCGCGAC 
CGCAGCGGCG TGATCGTCGG CGCCGTCGTG GTGTTTCGCG ACGTGAGCCA GCGCCGCGAG 
GCCGACGAGA AGCTGCATGC CGCGCTCGCC GAAGTCGACC GGCTGCGCGA GCGGCTGCAG 
CTCGAGAACG ATTACTTGCA GGAAGAGATC CGGATCGAGA CCAATCCGCG CGGCATCATC 
GGCCAGAGCG AAGCGATCCA GACCACGCTG CGCCAGGTCA AGCTGGTGGC GCCGACCACC 
GCCGCGGTGC TGATCACCGG CGAATCCGGC ACCGGCAAGG AACTGATCGC GCGCGCCATC 
CACGACGCCA GCACCCGCAG CGGCCGGCCG CTGATCCGGG TCAATTGCGC CGCGATTCCG 
CGCGAATTGT TCGAGAGCGA ATTCTTCGGC CACACCCGCG GCGCCTTCAC CGGGGCGGTG 
CGCGACCGCA TCGGCCGGTT CGAGCTGGCC GACGGCGGCA CGCTGTTCCT CGACGAGATA 
GGCGAGATCC CGCTGGAGCT GCAGGGCAAG CTGCTGCGCG TGCTGCAGGA GGGCAATTTC 
GAGCGGGTCG GCGACGAGCG CACCCGCAAT GTCGACGTCC GGCTGATCGC CGCCACCAAT 
CGCGACCTGA AGCAGGAGGT GCAGCGCGGC CGTTTCCGCG AGGATCTGTA CTTCCGGCTC 
AACGTGTTTC CGATCGAGTC GGTGCCGCTA CGCGATCGCC GCGAGGATAT TCCGTTGCTG 
GCGCAGCACT TCCTCGCCAG CGAGCGGCGC GAGCTGAAAT CCGGACTGCG GCTGTCGCAG 
GGCGACGTGC GGCGGCTGAT GCGCTACGAG TGGCCGGGGA ACGTCCGCGA ATTGCAGAAC 
GTGATCGAGC GCGCCACCAT CCTGGCACAG AACGGGCGGC TGCGGATCGA TTTGCCGGAG 
CCGTCCGGCC ACCATCCCGC GCCGAACGCC GGCCGGCAGA AATCCGAAAC GCGACCCGCG 
GTGATGACCG CCGCGGAGCT GCGCGATCTC GAGCGCGCCA ACATCGTCGC CGCGCTACGC 
GCGTGCAACG GCAAAGTGTT CGGCGACGAC GGCGCAGCGG CGATGCTCGA CCTCAAGCCG 
ACGACGCTGG CGTCGCGGAT CAAGGCATTG GGCATCAGCG CGACACGGGC CGCGAACGGC 
AGTGCAGTCG ACTGA

Protein sequence

MLRNLVVYDF SESNYEISEQ VVDLPVPFSA TDTDLRAEAF DGLIEAALLL DPAADQILEV 
NPAACALLGY DRATLLQTRI SALHDRQFPA LIVFTQAVFD RGSYWTHALT PNHGAGTPLR 
VEYAGRALQS RGRTLLLLTM SDLEQRRRRH IDAAADDYMR DGLPAWQRVE RVFEDIEREN 
QLILRAAGEG IYGVNAEGRA TFVNPAAERM LGWSAEELVG RSIHAVMHHT HHDGRPYADH 
DCPIYAAFRD GAVHTVDGEV FWRKDGKPVW VEYTSTPIRD RSGVIVGAVV VFRDVSQRRE 
ADEKLHAALA EVDRLRERLQ LENDYLQEEI RIETNPRGII GQSEAIQTTL RQVKLVAPTT 
AAVLITGESG TGKELIARAI HDASTRSGRP LIRVNCAAIP RELFESEFFG HTRGAFTGAV 
RDRIGRFELA DGGTLFLDEI GEIPLELQGK LLRVLQEGNF ERVGDERTRN VDVRLIAATN 
RDLKQEVQRG RFREDLYFRL NVFPIESVPL RDRREDIPLL AQHFLASERR ELKSGLRLSQ 
GDVRRLMRYE WPGNVRELQN VIERATILAQ NGRLRIDLPE PSGHHPAPNA GRQKSETRPA 
VMTAAELRDL ERANIVAALR ACNGKVFGDD GAAAMLDLKP TTLASRIKAL GISATRAANG 
SAVD