Gene RPD_4236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4236
Symbol
ID	4024757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4703609
End bp	4704874
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	67%
IMG OID	637964442
Product	hypothetical protein
Protein accession	YP_571354
Protein GI	91978695
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.046998
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGAT TGATCGACGC GCTGCGCAGC GGGGACTGGG TAACTCGCCC GCGGATCCGG 
CTGTGGGCGC TCGCGGTGCT CGCCGCCTCG CTGGGCGGGT TGCTGTATCT GGTCGCGACC 
GCGAACGGGC TGAACGACTT CAAGGGCCGG CCGCTCGGCA CCGACTTCTC CGACATCTAT 
GCCGGCGGCA CCTATGCGCT CGAGGGGCAG GCGGCGCTGG CGTTCGACCC CGAAACCCAA 
CATGCCCGCG AGCAGACGAT CTTCGGCGCC GATACGCCGT TCTACGGCTG GCACTATCCG 
CCGTTCCTGA TGTTCGTCGC CGCGCCGCTG GCGATGCTCC CTTATCCGTC GGCGCTTGCG 
ATTTGGCAGA TCGCGACGCT GCTGATGTAT CTCGGAATGC TGGCGCTGGT GCTGCGCCTG 
GCGTCGCGCG GACAGGGCGT CGACCCTCCA CAGCAGAAAT TGTGGCTGTT GCTCGCACTC 
GCTTCGCCGG CTGCCTTCGT CAACATCTCC CATGGTCACA ATGGCTTTCT GACCGCGGCG 
TTGATCGGCA CGGCGCTCGC GCTGCTCGAT CGACGGCCGA TGGTCGCGGG CGTCCTGATC 
GGGCTGCTAT CCTACAAACC GCAATTCGGC GTGATGATTC CGCTGGTGCT GATCGCGACC 
TGGCGCTGGC GCGCCTTCGT CTCTGCTGCG CTGACCGTGC TCGCGCTGGC GCTCGCCACC 
ACGTTTGCTT TCGGCTTCGA GGTTTGGCGC GCCTTCTTCG AAGCAATGCC GTTCACCCAG 
AAAGTGGTGC TGGAGCAGGG CGGCACCGGT TGGCACAAGA TCCAGTCGGT TTTCGCCTGG 
GTGCGGATGT GGGGCGGCGG CGTGCAGCTC GCTTATGCGA TCCAGGGCGC TGTCATGGTG 
ACGCTGGCGG CCGCGTTGGT CTGGCTGTGG CGCAGCCGTG CGGCGTATTC CCTGAAGGCC 
GCGGCGCTGA TCGTCGCGTC GATTTTGGCG ACGCCCTACA GCCTCGACTA CGACTTCGTC 
GCGCTCGCGC CGGCGATCGC CTTCCTGGCC GCCCACGGGC TCGCCCGCGG TTTCGCGCCG 
TGGGAGAAGA CCGCGCTGGC GCTGCTGTGG CTGATGCCGC TGGTGGCGCG CGGCCTGGCC 
GAGCAGACGC TGATCCCGCT CGGCGTGCCG TCGATGCTCC TGGTGTTCGT GCTGATCATC 
AAGCGCGCTG CGCAGGAATC CGGCGCGCGC TCCGCGTCGT CGTCCACGCC GCAGCCGATC 
GTCTGA

Protein sequence

MSRLIDALRS GDWVTRPRIR LWALAVLAAS LGGLLYLVAT ANGLNDFKGR PLGTDFSDIY 
AGGTYALEGQ AALAFDPETQ HAREQTIFGA DTPFYGWHYP PFLMFVAAPL AMLPYPSALA 
IWQIATLLMY LGMLALVLRL ASRGQGVDPP QQKLWLLLAL ASPAAFVNIS HGHNGFLTAA 
LIGTALALLD RRPMVAGVLI GLLSYKPQFG VMIPLVLIAT WRWRAFVSAA LTVLALALAT 
TFAFGFEVWR AFFEAMPFTQ KVVLEQGGTG WHKIQSVFAW VRMWGGGVQL AYAIQGAVMV 
TLAAALVWLW RSRAAYSLKA AALIVASILA TPYSLDYDFV ALAPAIAFLA AHGLARGFAP 
WEKTALALLW LMPLVARGLA EQTLIPLGVP SMLLVFVLII KRAAQESGAR SASSSTPQPI 
V