Gene RPD_3956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3956
Symbol
ID	4024472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4404206
End bp	4405396
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	66%
IMG OID	637964158
Product	hypothetical protein
Protein accession	YP_571076
Protein GI	91978417
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGATCT GCGCCATTTG TGGCCAGGAC ATAGCGCCCG CCGATGACTC CGAGGAGCAC 
ATTCTGCCCG GCGCGATCGG CGGGCGCCGA ACCGTGGGCG GATTCCTGCA CGACGGCTGC 
AATCACCGCT CGGGCCATAC CTGGGACGCG GCGCTTGAAA AGCAGCTGCG ACCGCTGGCT 
CTACATTTCG GCGTGAAGCG CCAGCGTGGG CGTACCTTAC GCATGGCGGT CACCACGACC 
GCTGGGGAGA ATCTCCTGCT AAATGCCGGC GGCCAGCTGG AAATGGCCCG GCCGGAGATC 
AAGCGCACGC CGATCCCGGA TGGCGAGACC ATCGCGGTCA AGGCCGGGTC GATCGCCCAG 
GCGCGCGACG TGCTGGAAGG GGTGAAGCGT AAATATCCGA AGGTGGACGT GGAGGCGGCC 
TTGGCCGGCG CCGAAATCCA ACGGTCCTAC GCGAAGGGTG TCGTGTGCAT TGACGTGAAC 
TTCGGGGGCC CATTGTCGGG CCGGTCCCTC GTCAAGAGCG CCTTGGCGCT GGCACACGAG 
ACCGGCCTCC CGATAGGCCA ATGCCGCGAC GCGTCGGCCT ACCTGCGCGA AGCCGACGCA 
GAACCCTGCT TCGGCTATTA CTACGTCGAT GACCTCGTCG ACGGCCGGCC GCCGGCGATG 
CCGCTGCACT GTGTCGCCAT CGATGCCAAC CCTGAGACAG GATTGATCTT GGGCTACGTA 
GAATACTTCG GCATCCACCG GGCCGTGGTC TGCCTCGGCC GTGACTATGT CGGCGACCGC 
CTGAAGGCGG TCTACGCCCT CGATCCGCGC ACCGGCGAGA CCGTGGAGGT AGCGGTGCGC 
CTCGATTTCG ACGTCGCCGA TATGCGGGCG ATCTACGATT ATGGGCGCGA CGATGCCGAA 
AAGCGGCAAG AGGCCTTCGG CGCCGTGTTC GGACCAGTCT TGGGCTCGCA TCAGGCCGCT 
GAACGTGACC GGGTGGTCCA CGACAGCCTG AACTTCGCCT GGGCCAACTG CGGCGGCGTG 
CCGGATCAGC CACTGACCGC TGAGCATCTA GCAAAGCTGA TGGAGCTGTT CGCCGACCGT 
GCCACGCCGT GGTGGAAGCA CGTCACGGGC CTGAGCGATG CGGCGGCTCG CCAACTCGCC 
TTGGCCTATA TCAGCCAGGT GCTGGCCGTA ACGCAATCGA CGCCGGTTTA G

Protein sequence

MPICAICGQD IAPADDSEEH ILPGAIGGRR TVGGFLHDGC NHRSGHTWDA ALEKQLRPLA 
LHFGVKRQRG RTLRMAVTTT AGENLLLNAG GQLEMARPEI KRTPIPDGET IAVKAGSIAQ 
ARDVLEGVKR KYPKVDVEAA LAGAEIQRSY AKGVVCIDVN FGGPLSGRSL VKSALALAHE 
TGLPIGQCRD ASAYLREADA EPCFGYYYVD DLVDGRPPAM PLHCVAIDAN PETGLILGYV 
EYFGIHRAVV CLGRDYVGDR LKAVYALDPR TGETVEVAVR LDFDVADMRA IYDYGRDDAE 
KRQEAFGAVF GPVLGSHQAA ERDRVVHDSL NFAWANCGGV PDQPLTAEHL AKLMELFADR 
ATPWWKHVTG LSDAAARQLA LAYISQVLAV TQSTPV