Gene RPD_0008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0008
Symbol
ID	4020462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	9267
End bp	10505
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	60%
IMG OID	637960184
Product	divergent AAA region
Protein accession	YP_567149
Protein GI	91974490
COG category	[K] Transcription
COG ID	[COG2865] Predicted transcriptional regulator containing an HTH domain and an uncharacterized domain shared with the mammalian protein Schlafen
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGTTC GCGAAATTGG CGCATGGCGG CTGGTCGGCG GCGAAACCGA CCGCATCGAG 
TGCAAGGCAG GTTTCCGGCT TCAGCCGGAG GATCGGTTCT CGAAGGCGCT TCGCGCGATC 
GCTGGGTTGG CCAACAACAA GGGCGGCTAC ATCCTATTCG GCGTCACGGA CGGGACCTAC 
CAGGCGGATG GACTTTCCGA CGACGTATTC ACAAAATCAG ACATCTCGCT TCTCAACAGA 
ATCTTGGCGA GCGCTCTTGA CCCCGTTCCT CACGTCACAA AGGGCCTCAT CGAGCTCGGC 
GGAAAGCAGG TGGGTGTTCT CTACGTGGAA AAGCACGATC ATGGCCCCGT CATTGCCGTC 
AAGAACGTCA GTCAAGATGT GAAGGAAGGA GGCATCTATT TCCGGTACGT CGGAGAAACC 
CGCCTGATCA AGCCTGGAGA GCTCAGGCAG ATCATCGCCG CGCGCGAACA GCGGGCGGTC 
GCTGAATTCA GTGCCCGCAT GAATCGCGTC GCTGTTGGTA AGGAAGCTAC GATCGACCTC 
GATTCCGGCG AGGTCGCCGG CACAAGCGGC AAATTCCTCA TCGACAAATC TTTGCTCTCC 
AGCATTCAGT TCGTGCGCGA GGGCGAGTTC GACGAAAAAA AGGGAGCGCC TGCACTCAGA 
CTGATTGGCG ACGTCGAGCC CGTTTCGGCG GTGGAAAGGG AGCGAACGAG GGTTATCCGC 
GAGAACGTGA CCCCCGACGC GGTCGTCCGC AACTTCCTGC GGAACGAGAA GGTCGCGGAG 
CCGACGCAGT ACATCCATTT CCAGGCTCAC TCCCAACGGA AGTGGTTTCC CGTATGGTTC 
TACATAGATC AGACGCGGTC GACCGCCTCC GAGGTCGCCG AGGATCTGCG CAAACAGGTC 
GCCACCTATC CGTCGTCGCG CGACGCGCTG GTCGACCGGC TCGCGGGAAA GGACGCAGCC 
TTCCGCCAAT CCACCGGGAA GGCCGAAGCT CTGCGCGCGA AGTTAGCGCG GGGCGACATC 
AAGGCCCCGA CCGACATCGA CGCAGACGTC GTTTTCGCTG GTGCTGTCCA AGCGCTGCCT 
ACGACTATGA AGCCAAAAGA CCTTGAGAGC ATTAGGACGG CCCTGCTCGA TTGCCTGGAT 
CGCGCGCAGG ACACCGACCC CCGCAGCAGC AATCGTCGCG GAGCCATCTA CCGGGCCGCA 
TGCCGTCTCG ACGAGTTGCT TTACTCGAAG AAAAGGTGA

Protein sequence

MFVREIGAWR LVGGETDRIE CKAGFRLQPE DRFSKALRAI AGLANNKGGY ILFGVTDGTY 
QADGLSDDVF TKSDISLLNR ILASALDPVP HVTKGLIELG GKQVGVLYVE KHDHGPVIAV 
KNVSQDVKEG GIYFRYVGET RLIKPGELRQ IIAAREQRAV AEFSARMNRV AVGKEATIDL 
DSGEVAGTSG KFLIDKSLLS SIQFVREGEF DEKKGAPALR LIGDVEPVSA VERERTRVIR 
ENVTPDAVVR NFLRNEKVAE PTQYIHFQAH SQRKWFPVWF YIDQTRSTAS EVAEDLRKQV 
ATYPSSRDAL VDRLAGKDAA FRQSTGKAEA LRAKLARGDI KAPTDIDADV VFAGAVQALP 
TTMKPKDLES IRTALLDCLD RAQDTDPRSS NRRGAIYRAA CRLDELLYSK KR