Gene RPC_3514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3514
Symbol
ID	3973880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	3905310
End bp	3906725
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	62%
IMG OID	637926626
Product	XRE family transcriptional regulator
Protein accession	YP_533373
Protein GI	90425003
COG category	[R] General function prediction only
COG ID	[COG3800] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.15562
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA CCTTTCTCGG AGTCCGGTTG AAACGGCTGC GTGAGGAGCA TCGCCTGACC 
CAGGCCGCGC TCGCCGCCAA GCTTGGTATT TCGCTGAGTT ACCTCAACCA GTTGGAGAAT 
AATCAGCGAC CGCTCACGCT TCCGGTGGCG CTGGCGTTGA ACAAGACGTT CGGACTCGAC 
ATCCAGTCTT TTTCAGAGGA CGACGAAGCG CGTTTGATTG CCGATTTGCG CGAGGCGGTT 
GCCGATCCCG CCTTGGGCGA AACCATCGCC ACCTCCGATC TGCGCGAACT GGCACTCAAT 
ATGCCGGCGA TCGGTCGGAC GCTGGTTGCG CTGTCGCAGA GATATCGCCA AGCCATCGAG 
CAGTCCGCGG CGCTCTCCGC CCGGCTCGGG GAGGATCGCC AGGCCGCTTC GGCGATTCTG 
CCTTCGACCC CGTTCGAGGA GGTCCGCGAT TTCTTCTATG CCCAGCATAA CTACATTCCC 
GAACTCGACG AAGCCGCCGA GGCAATCGCC TTGCGAATGA ACCTGCCGCC CGGACGGATG 
GCGCCCGCTC TGTCGTCTTT TCTCGAAGAT CGCGGCATGA CGATATTGAT CGGCGGCTCC 
ACCGAATCCG GTCTGCAGCG GGAGTTTGAT CGGCAAACCC GCACCGTGCG GCTGTCGTCG 
AGCCTTCACC CCGGACAGCA AGCTTTCCAA TTGGCAACCC ACATCGCTTT TCTCGATTTC 
GACGACGCCA TCCGTTCAAT CGTCAGCAAC GCAGCATTCA CCAGCGACGA ATCGCGTGGC 
CTCGCGCGGA TCGGGCTCGC GCATTATTTC GCGGGCGCGC TGGTGTTGCC CTACTCGGCG 
TTCCTCCAAG AGGCGCAGCG CCGCCGTTAC GATATCGAAT TGCTCGGCCA CACTTTCGGC 
GTCGGATTTG AAACCGCGTG CCATCGCTTG AGTACCTTGC AGCGCCACAA TGCCCGGGGC 
GTCCCGTTCT TCTTCATTCG CGTCGATCGG GCCGGCAATA TTTCGAAACG TCAATCCGCG 
ACCGACTTTC ATTTTTCGCG GGTCGGCGGC ACCTGTCCGC TGTGGAACGT CTATGAAGCC 
TTCGCCTGTC CTGGACGAAT CCTCACCCAG TTGGCGCGAA TGCCGGACGG GCGAACCTAC 
CTTTGGATCG CCCGCACGGT GTCGCATAGC CAGGGCGGCT ATCGGGCGCC CGGGAAAACC 
TTCGCGGTGG CACTCGGCTG CGACGTCCGC CATGCCGGTA GCGTCGTCTA TTCGGAGGGA 
CTCGACATCG ATCCGGCAAT CGCGACGCCG ATCGGCATGG GCTGCAAGGT CTGCGAACGG 
CCGAATTGTC CCCAGCGGGC CTTCCCGCCG ATTGGTCATG CGCTCAACGT CGATGAGACG 
CGCGCGCATT TTGCCCCCTA CGCGACCTCG TCTTGA

Protein sequence

MKKTFLGVRL KRLREEHRLT QAALAAKLGI SLSYLNQLEN NQRPLTLPVA LALNKTFGLD 
IQSFSEDDEA RLIADLREAV ADPALGETIA TSDLRELALN MPAIGRTLVA LSQRYRQAIE 
QSAALSARLG EDRQAASAIL PSTPFEEVRD FFYAQHNYIP ELDEAAEAIA LRMNLPPGRM 
APALSSFLED RGMTILIGGS TESGLQREFD RQTRTVRLSS SLHPGQQAFQ LATHIAFLDF 
DDAIRSIVSN AAFTSDESRG LARIGLAHYF AGALVLPYSA FLQEAQRRRY DIELLGHTFG 
VGFETACHRL STLQRHNARG VPFFFIRVDR AGNISKRQSA TDFHFSRVGG TCPLWNVYEA 
FACPGRILTQ LARMPDGRTY LWIARTVSHS QGGYRAPGKT FAVALGCDVR HAGSVVYSEG 
LDIDPAIATP IGMGCKVCER PNCPQRAFPP IGHALNVDET RAHFAPYATS S