Gene RPD_3893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3893
Symbol
ID	4024409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4329311
End bp	4330936
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	71%
IMG OID	637964097
Product	hypothetical protein
Protein accession	YP_571015
Protein GI	91978356
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0724599
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGATT ACTATCCGCT GATTGCGCGC GCCATATCCG GCCTGGACCC CAGTGCTCCG 
GGAGAGCAGC GCCGTGCGAT CTACGAGCGG GCCCGCGCGG CCTTGATCGC GCAACTGCGC 
GGCGTCCAGC CGCCGCTGAC CGAATCCGAG ATCACCCGCG AGCGGCTGGC GCTCGAAGAG 
GCGGTGCGCA AGGTCGAGTC CGAGGCCGCG CAACGTTCCC GCGACGCCTC CCGCGCCGAG 
CTGAAGAATC GCCGGCCCGC CGGCGAGGCC GCGCGTCCGG GCGACGCGCT GCGGGCGTCG 
AGCCGCGCGC CGTCGCGCCC GGGCGATCCG CCGCCGCAGG TCAGCCGCGC GCCGTTGCCG 
CCCGGCGCGG CCCAGGCCGA ACCGGAGCCG CCGGTGCGCC CGCGGTCGCA GTCGCCGGCG 
CCGCCGCGTG AAGACCGGCC GCAACGCAAT CTTCGGGTCG ATCCGCCGCC GATCCCGCCG 
GAGCCCGGCC GCGAGCGTCC TGCGCCGCGC CGTCCGGATC AGGGCCAGAG TGCGGGCCAA 
GGTCCAGGCG CTGGCCAGGG CGCCAATCCG GCCGCCGACA ATGGGCTGCG CGGCTTCCGC 
GACGTCACCG CGGATCTCGA CGATATCGGC CGCGCGGCCG CGCAGGCCAA TCGCTCGGCG 
CGCAAGACCT ACGCCAATGT CGCGCCGTCG CCGGAGTTCG ACCGGCTCGA ACCGTCGATG 
GAGAACCGCA CCGATCCGGG CGCGCCGTAT TCCTATGACG AGTCGATCGA CGAGGCGTCG 
CGCTATGCGC CGCAGCCCGC CACCACGCGA CCTCGAATCG AGCCGGATCG CAAGGCTTCG 
CGCAAGCCGA CGCGCAAGCC GTCGCGCTTC CCGCTGCGCA GCGCGTTGGT GATCGGTCTT 
GTGCTGGTGC TGGTCGGCGC CGGCATCTTG TGGGGGCCGT CGCTGTGGTC GGCGATGCGC 
GGACTGATGA AGTCGCAGCC CTCGACCGAG ACCGCGACCA CCACCGCGCC GCCGGCCTCG 
ACCGAGCGGC CGAAGATCAC CGACCGCGTC GGCCAGCCTT CGTCGTCGGA AATGGTGGCC 
CCTGTCGCTC AGCGCGTTGT GCTGTACGAC GAGGATCCGT CCGATCCCAA GGGCAAGCAA 
TATGTCGGCA CGGTGGTATG GCGCACCGAG CAGATCAAGG GCGCCAGCGC CAAGGGCGGC 
GCCGACCTCG CGGTGCGCGC CGACATCGAG GTGCCCGAGC GCAAGTTCAA GATGACGATG 
TCATTCCGCC GCAACACCGA CACCTCGCTG CCGGCGAGCC ACACGGCAGA GCTGACGTTC 
ATCCTGCCGC AGGATTTCAC CGGCGGCGGC GTCGCCAACG TTCCCGGCAT CCTGATGAAG 
TCGAACGAGC AGGCGCGCGG AACGCCGCTG GCCGGCCTCG CGGTCAAGGT CACCGACGGC 
TTCTTCCTGG TGGGCCTGAG CAATGTCGAG GCCGACCGCG CGCGCAATTT GCAGCTCCTG 
AAGGAGCGCT CCTGGTTCGA CGTGCCGATC GTCTACACCA ACCAGCGCCG CGCCATCATT 
GCGATCGAAA AGGGTCCGCC GGGAGAGCGC GCCTTCTCCG AAGCGTTCGG CGCCTGGGGC 
GAGTAA

Protein sequence

MADYYPLIAR AISGLDPSAP GEQRRAIYER ARAALIAQLR GVQPPLTESE ITRERLALEE 
AVRKVESEAA QRSRDASRAE LKNRRPAGEA ARPGDALRAS SRAPSRPGDP PPQVSRAPLP 
PGAAQAEPEP PVRPRSQSPA PPREDRPQRN LRVDPPPIPP EPGRERPAPR RPDQGQSAGQ 
GPGAGQGANP AADNGLRGFR DVTADLDDIG RAAAQANRSA RKTYANVAPS PEFDRLEPSM 
ENRTDPGAPY SYDESIDEAS RYAPQPATTR PRIEPDRKAS RKPTRKPSRF PLRSALVIGL 
VLVLVGAGIL WGPSLWSAMR GLMKSQPSTE TATTTAPPAS TERPKITDRV GQPSSSEMVA 
PVAQRVVLYD EDPSDPKGKQ YVGTVVWRTE QIKGASAKGG ADLAVRADIE VPERKFKMTM 
SFRRNTDTSL PASHTAELTF ILPQDFTGGG VANVPGILMK SNEQARGTPL AGLAVKVTDG 
FFLVGLSNVE ADRARNLQLL KERSWFDVPI VYTNQRRAII AIEKGPPGER AFSEAFGAWG 
E