Gene RPD_4135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4135
Symbol
ID	4024657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4603347
End bp	4604660
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	63%
IMG OID	637964343
Product	protein of unknown function DUF224, cysteine-rich region
Protein accession	YP_571255
Protein GI	91978596
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.335861
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACTG AATTCAGTCT CGCCCAGCTC GCCGATCCGG ATATCGCCGA GGCCGACAAG 
ATCCTGCGCG CCTGCGTGCA TTGCGGGTTC TGCACGGCGA CGTGCCCGAC CTATGTGCTG 
CTTGGCGATG AACTCGACAG CCCGCGCGGC CGCATTTACC TGATCAAGGA GATGCTGGAA 
AACAACGCGC CGCCGACGGC GGACGTGGTC AAGCATATCG ATCGCTGCCT GTCGTGCCTC 
GCCTGCATGA CCACTTGTCC GTCGGGCGTG AACTACATGC ATCTGGTCGA TCAGGCGCGC 
GCCCGGATCG AGCGGGACTA TACGAGGCCG CTGCCCGATC GCCTCGTGCG CGAGCTGTTG 
TCGTGGCTGA TGCCGCACCC CGGCATGTTC CGTTTCAGCA TGTGGATGGC GCGGCTGTTG 
CGGCCGGTGG CGGCGCTGCT GCCCGGATCG CACGATCTCG CCCATCCGAC GTTCCTCAGC 
CGGATCAAGG CGATGCTGGC GCTCGCCCCG AAGCATTTGC CGGAGCCTGG CCCGGCCTCT 
GGAACCATGT TCCCGGCGGT CGGACCCAGG CGCGGACGCG TCGCACTGCT GCACGGCTGC 
GCCCAACAGG TTCTGGCGCC GCGTATCAAC CGCGCCGCCA TCAATTTGCT GACACGCCAC 
GGCATCGAGG TCGTGCTCGC GGCGGATGAA GCCTGCTGCG GCGCCCTGAT CCATCATCTG 
GGGCGTGACA CGCGGACCCT CGAATACGCC CGTACCAACA TCAAGGCGTG GCTGCGCGAG 
ATCGATCGCG GCGGCCTCGA CGCGGTTCTG GTGACGACCT CAGGCTGCGG CACCGTCATC 
AAGGACTATG GTTACATGTT GCGCGAGGAT CCGGAATTCG CGGCATCGGC GGCGAAGGTC 
TCGGCGCTCG CAAAGGATAT CAGCGAATAT ATCGGCACCC TTGAGCTGTC GCCGCCGCAG 
CCGCATGGCG ATGTCGTCGT CGCTTATCAC TCCGCATGTT CGCTGCAGCA CGGTCAGAAA 
GTCACGCAGC TCCCCAAAGA ATTGCTTTCC AAGTCCGGAT TCGTGGTGAA AGATATCCCG 
GAGAGTCATT TGTGTTGTGG TTCGGCGGGC ACGTACAACA TTCTCCAGCC TGACATCGCG 
ACCAGATTGC GCGACCGCAA AGTCGCCAAC ATCGCTTCCG TCAAGCCGGA CATGATTGCC 
GCTGGCAATA TCGGCTGCAT GGTGCAGATC GCCAGCGGAA CGGACGTCCC TGTAGTGCAC 
ACGATTGAGC TTCTCGATTG GGCGACAGGT GGTCCCCGGC CGGCGATCAG CTGA

Protein sequence

MKTEFSLAQL ADPDIAEADK ILRACVHCGF CTATCPTYVL LGDELDSPRG RIYLIKEMLE 
NNAPPTADVV KHIDRCLSCL ACMTTCPSGV NYMHLVDQAR ARIERDYTRP LPDRLVRELL 
SWLMPHPGMF RFSMWMARLL RPVAALLPGS HDLAHPTFLS RIKAMLALAP KHLPEPGPAS 
GTMFPAVGPR RGRVALLHGC AQQVLAPRIN RAAINLLTRH GIEVVLAADE ACCGALIHHL 
GRDTRTLEYA RTNIKAWLRE IDRGGLDAVL VTTSGCGTVI KDYGYMLRED PEFAASAAKV 
SALAKDISEY IGTLELSPPQ PHGDVVVAYH SACSLQHGQK VTQLPKELLS KSGFVVKDIP 
ESHLCCGSAG TYNILQPDIA TRLRDRKVAN IASVKPDMIA AGNIGCMVQI ASGTDVPVVH 
TIELLDWATG GPRPAIS