Gene RPC_2019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2019
Symbol
ID	3973919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	2201967
End bp	2203427
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	59%
IMG OID	637925128
Product	GntR family transcriptional regulator
Protein accession	YP_531893
Protein GI	90423523
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.437741
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCACCTTT TGAGATATGG TACGCAATAC AAAATGGCTG TCAATTTGAA TAATGACACC 
GTTTCAATCC TTCATAGCGC GTTGCGCGAA GGCATGGGAC CGAAGTACCG GCGGCTGGCG 
CGACGGCTCG AGGCACTAAT CCTGAGCCGC GGGTTACGGA CCGGCGAAAA GTTACCGGCT 
CACCGCGACC TGGCTGCGCT CCTGGGCGTG ACGGCAGGAA CGATTAGTCG GGCTTACGGC 
GAGTTGCGGA AGATCGGGCT GATTTCGTCC CGCGTGGGCG ACGGCACCTT CGTGCTGGAA 
TTGGCAAAGA AGAAGCGCAA GGAAACCGAC TTCAAGCCTT ACGGGGGCGG CGAACCGGGT 
CGCTACGACC TCAGTCGGAA TACGGCGATC CCCGGCCGCA TGCTAACATC GGTCAGCGAA 
ACGTTGCGGC GTCTGGCGCT GCAGCCGGAG GCTCTCGAAG AACTGCTGCA ATATGGGCCG 
GAGCTTGGAT TGAATCGCCA CCGCGCGGCG GGAGCCCGGT GGCTCAGCAA CCATCATTCC 
GACGCCAACG CCGAACAGAT CGTCTGCGTC AACGGCGGCC AGCACGGCTT GTTCTGCGTG 
CTCATGGCGC TGCTCGAACG TGGTGACACC CTGGTCTCCG AACAGTTCAC CTATCCGGGA 
TTGATATCGG CCTGCCGAAT TCTTGGCATC AATCTGGTCG GCCTCAAGAT GGATGACGAA 
GGGCTGATTC CGAAATCGCT CGATGCAGTC TGCCGGACTG CAACGGTCAG AGCGCTGTTC 
TGCACGCCGA CGCTGCAGAA TCCCACCACG GCGGTGCTTG GCCTGGAACG GCGCGCCGAG 
ATCGCCCGGC TTTGTCGCGC GCATAATCTA TTGGTCATCG AAGATGACGC GCACGGCGTC 
TTGGTCAAGG ATCGTCACCC GCATATCGGA CATTTCGTAC CGGAACGAAG CATTCTGATT 
TCAAGCCTGT CAAAAGCGAT CGCGGCCGGC CTGAGGGTCG GCTACGTCCA TGCGCCGTTG 
CCATTGGTCG GACGCATCGG CACCATGGTG CGAACCAATT GCTGGATGGC GAACCCTCTG 
GCCTTCGAGA TGGTCAGTCT CTGGATCGAG GACGGCAGCG CGCTGCGCTT CCTCGAAGAC 
CAGATCGAGG AAATCGTTCG ACGCAAAACC CTCGTTCAAC CGCTTCTGGA CGGCTTCGTC 
GTCAAAACCC ATCCAAGGAG TCCGCACTTC TGGATCGAAG TTCCAAGCCC TTGGCGCGCC 
TCAGAGATTG CAAGCGAGTT AAGGCAGAAG AACTGTCTCG TTGCGCCTGC GGAGGCATTC 
GCCGTGGACC GTGACCGCAC CGTCCAATTT CTGCGGGCTA GCGTTAGCAG CGCTGAAAAG 
ACCGACGCTG CCATCAGTGA AGGATTTCGC ATTCTCTCCG CCGTATTGAG AAATCCTTCA 
ACAACTACCG CGATCCACTA G

Protein sequence

MHLLRYGTQY KMAVNLNNDT VSILHSALRE GMGPKYRRLA RRLEALILSR GLRTGEKLPA 
HRDLAALLGV TAGTISRAYG ELRKIGLISS RVGDGTFVLE LAKKKRKETD FKPYGGGEPG 
RYDLSRNTAI PGRMLTSVSE TLRRLALQPE ALEELLQYGP ELGLNRHRAA GARWLSNHHS 
DANAEQIVCV NGGQHGLFCV LMALLERGDT LVSEQFTYPG LISACRILGI NLVGLKMDDE 
GLIPKSLDAV CRTATVRALF CTPTLQNPTT AVLGLERRAE IARLCRAHNL LVIEDDAHGV 
LVKDRHPHIG HFVPERSILI SSLSKAIAAG LRVGYVHAPL PLVGRIGTMV RTNCWMANPL 
AFEMVSLWIE DGSALRFLED QIEEIVRRKT LVQPLLDGFV VKTHPRSPHF WIEVPSPWRA 
SEIASELRQK NCLVAPAEAF AVDRDRTVQF LRASVSSAEK TDAAISEGFR ILSAVLRNPS 
TTTAIH