Gene RPD_4364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4364
Symbol
ID	4024889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4827599
End bp	4829242
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	71%
IMG OID	637964574
Product	hypothetical protein
Protein accession	YP_571482
Protein GI	91978823
COG category	[S] Function unknown
COG ID	[COG2845] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.242924
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACA AGCCGAAATC CCTGCTGGGC ATTCTGACCA GGCGCGGACC GCTGCTGGCG 
ATCGCCGCGC TGCTGCTGGT CGGCATCGCG GGACCGGCTT CGGCGCAGTT CTTCGGCTTC 
GGCGGCCCGC CGCAGCAAGC GCCACGCCCG CCGCGCGGCG TCGGAGGTTA CAACGGCGGC 
GGCGGACTCT TCGGCAACGA CGTGTTCGCG CCGTTCCAGC ACCAGGCGCC GCGCCGCGCC 
CCGGTGCGCG AGGACTATTC CCGCGCGCCC GCGGCCGAGA AGCGCGACGC CGTCTCCGAG 
CGCAACGTCG TGGTGCTCGG AGACGCGATG GCCGACTGGC TCGCTTACGG CCTCGAGCAG 
GCCTATGCCG AGCAGCCCGA CATGGGCGTG ATCCGCAAGC ACAAGACCGT CTCCGGCCTG 
CTGCGCTACC AGCCCAAGGG CGAGCCCTCC GACTGGGTCG CCGCCGCCAA GGAGATCCTC 
GCCGGCGAAA ACCCGGATGC GATCGTGGTG ATGCTCGGCC TTAACGACCG CACGCCGATC 
AGCGAGCCGG TGGCCGAAAA GGACAAGAAG AAGGACGGCA AGGCGAAGCC CGAGGACGCC 
GACAGCGCCG CCAAGCCCGA CGCCAGCAAG CCCGACGCCA ATAAGCCCGA CGACAAGACC 
GCGGATAGCG ACGCAGCCGA CGATGACGAC GACGACGATG ACGGCACGCC GCAGATCATG 
ACGCGGGAGA AATCGAAGCG CGCCGGCGCC AGCCAGTTCC GCGATGATCG TTGGGTCGAG 
CTCTACAACA AGAAGCTCGA GGACATGATC AACGTTCTGA AGTCGAAAGG CGTGCCGGTG 
CTGTGGGTCG GCCTGCCCGC GGTGCGCGGC ACCAAGTCGA CCTCGGACGC GCAGTTCCTC 
AACGCGCTGT ATCGCGACGC CGCCGGCAAG GCCGGCATTA GTTACGTCGA CGTCTGGGAC 
GGCTTCGTCG ACGAGGCCGG ACGCTATCTG CTGCAGGGCC CGGACTTCGA GGGCCAGACC 
CGCCGGCTGC GCTCCTATGA CGGCGTGTAT TTCACCAAGG CCGGCGCGCG GAAGCTGGCG 
CATTATGTCG AGCGCGAGAT CGCCCGCCTG CTCGCCGCCC GCGCTGCGCC GGTCGCTCTG 
CCGACCGAAC CTGGCACGCC GGATGCGAGC GCCAAGCCGG GCGGCCCCGC ACCGCGACCT 
ATCGCCGGCC CGATCATGCC GCTGGTGGCG TCTTCGGTCT CGACCGATCG TCTGCTCGGC 
GGCCCCGGCA TCGCGCCCGC GCCGGTCGAT GCGCTGGTCG CGCGCACGCT GGTGAAGGGC 
GAGCCGCTCG CCGCGCCGGC CGGCCGCGCC GACGATTACG CCTGGCCGCG CCGCGAGATC 
GTAGTGGAGC GCGCGCAGGA ACCGCCGCCG ACGAAGGAGC CGCCGAAGAG CGCGGTGCCG 
ATGGCGAGCA CCAATCCGGG CGGCGCCGCG CCCAACGCGG CCGGACAGCA GCCGCAACAG 
CAGAAGCGCG TCGCCCGCGC CGCGCCGCCG CCTCCGGCCG CCTCCGGCTT CTTCGGCTTC 
GCGCCCGCGC CGCAGCAACC GCAGATGCGC CGCCCGCCAC CTCCGCCGCC GACCGCGTCG 
GGCTTCTTCT CGATCTTCCG CTGA

Protein sequence

MSDKPKSLLG ILTRRGPLLA IAALLLVGIA GPASAQFFGF GGPPQQAPRP PRGVGGYNGG 
GGLFGNDVFA PFQHQAPRRA PVREDYSRAP AAEKRDAVSE RNVVVLGDAM ADWLAYGLEQ 
AYAEQPDMGV IRKHKTVSGL LRYQPKGEPS DWVAAAKEIL AGENPDAIVV MLGLNDRTPI 
SEPVAEKDKK KDGKAKPEDA DSAAKPDASK PDANKPDDKT ADSDAADDDD DDDDGTPQIM 
TREKSKRAGA SQFRDDRWVE LYNKKLEDMI NVLKSKGVPV LWVGLPAVRG TKSTSDAQFL 
NALYRDAAGK AGISYVDVWD GFVDEAGRYL LQGPDFEGQT RRLRSYDGVY FTKAGARKLA 
HYVEREIARL LAARAAPVAL PTEPGTPDAS AKPGGPAPRP IAGPIMPLVA SSVSTDRLLG 
GPGIAPAPVD ALVARTLVKG EPLAAPAGRA DDYAWPRREI VVERAQEPPP TKEPPKSAVP 
MASTNPGGAA PNAAGQQPQQ QKRVARAAPP PPAASGFFGF APAPQQPQMR RPPPPPPTAS 
GFFSIFR