Gene RPD_0467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0467
Symbol
ID	4020935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	537900
End bp	539666
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	71%
IMG OID	637960654
Product	HemY-like
Protein accession	YP_567606
Protein GI	91974947
COG category	[S] Function unknown
COG ID	[COG3898] Uncharacterized membrane-bound protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.270683
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGCA TCATCCTGTT TCTCGTGATC ATCGCGCTCG CGGCCGCGGG CGCAGCCTGG 
GTGGCCGAAC AGCCCGGCGA TGTCGTGCTG TCGTGGAACG ACTGGCGCGC CGAGATGCGT 
CTGCCTGTGT TCGTCCTCGG GCTCGGCGCC GCGATCGTCT CGATCGTGCT CGCCTGGGCG 
ATCATCACCG GGCTGTGGCG TGCGCCGAGC CGGATGAAGC GCGGCCGCTT CGAACGTCGC 
AGCGGCCGGG CCCGCCACGC CATCACCCAG GGACTGCTCG CGGTCGGCCA TGGCGACGCC 
GCGGCGGCGC GCAACCACGC CAGCGCCGCG CGGCGGCACG CGCCGCACGA TCCGCTGGCG 
CTGCTACTGC AGGCGCAATC GGCGCAGCTC GAAGGCGACC GCGACGGCGC CCGCCGCGCT 
TTCCTGGCGA TGGCCGGGCG CGACGACACC AAATCGCTCG GGATGCGCGG CCTCTATATC 
GAGGCGCAGC GCGCCGACGA TCCCTACGGC GCGCTGGCGA TCGCCGAGGA AGCGCTGCGG 
CTGCAGCCGA ATTCGACCTG GGCGTCGCAG GCGGTGCTCG GCTTCCGCTG CGCCCGCGCC 
GACTGGTCCG GGGCGCTGGA TATTCTCGAA ACCAACCTGT CCTCCGGGCT GGTCGACAAG 
AAGGTCTTTC GCCGGCAGCG CGCGGTGCTG CTGACGGCGC GCGCGATCGA CCTCGAGGAC 
AGCGACGAGA GCCTGGCACG CGACAGCGCG CTCGAGGCCA ACAAGCTGGC GCCGACGCTG 
ATCCCGGCCG CGGTGCTGGC CGCGAAATGT CTCGCCGAGA CCCATCAGGT GCGCCGCGCC 
ATGAAGGTGA TCGAGGCGGC CTGGCAGGCC CAGCCGCATC CCGATCTGGC CGCCGCCTAT 
GCGAATATCA AACCGGGCGA TCCGGCCAAT ATCCGGCTGG CGCGGGTGCA GAACCTGATC 
GCCAAGAACC CGGCCGATTT CGAAAGCGCG CTGGCGATCG CCCGCGCCGG GATCGACGCC 
GGCGAATTTT CGCGCGCGCG CCGGGCGCTG CAGCCGTTCA TCGACAATCC GACCCAGCGC 
GTCGCGATGC TGATGGCCGA GATCGAGCAC GGCGAACGCG GCGACACCGC GAAAGCGCGC 
GCCTGGACGC TGCGCGCGGT GCGCGCGCTG CCGGATGCGA TGTGGACCGC CGACGGCTAT 
ACATCGGATC ATTGGCGCCC GGTGTCGCCC GTGACCGGCC GGCTCGATGC GTTCCAGTGG 
CAGGTGCCGA TCGCCGCGCT GCCGGCGAGG AAGGCGGTGG TGATCGAGGA CAACCCGTTT 
CACGACGCCC TGATCGCCTC CTCGGCGACC GAGGCGCTGC CGGCGGCCAA CGCCCATGAT 
CCGGTGACGG TGACGATCGA GTCGGTCGTC GAGACCACGG TGGTGGCGCC GAAGCAGGCG 
GAGGCAACCG TGGTGACGGT CGAGCCCGAG GCCGCCGCCG ACAAGCCGAA GGACCAGAAG 
GGCAGCTCCC GGGGAGGCGC AACCAAGGAT GCGGGCAAGA GCGCGCCGGA AGCGCCGGTC 
GCCGCGTCGG AGACCGTGAT CGCGATGCCG TCAACGCCGC TGTTCCATCG CCGCCCGAGC 
CAGGCCACGC CGCCGGTGAT CCCGATCGTC CGCGCCCCGG ACGATCCGGG CGTCGACGAA 
GAGGCCGCGC CGGGGGATTT TACCGAACAA TCGGCCGCGC CCGCCGGCCA GACCGGCAAC 
TGGCGCGGCT ACCGACCGCC GCGATAG

Protein sequence

MLRIILFLVI IALAAAGAAW VAEQPGDVVL SWNDWRAEMR LPVFVLGLGA AIVSIVLAWA 
IITGLWRAPS RMKRGRFERR SGRARHAITQ GLLAVGHGDA AAARNHASAA RRHAPHDPLA 
LLLQAQSAQL EGDRDGARRA FLAMAGRDDT KSLGMRGLYI EAQRADDPYG ALAIAEEALR 
LQPNSTWASQ AVLGFRCARA DWSGALDILE TNLSSGLVDK KVFRRQRAVL LTARAIDLED 
SDESLARDSA LEANKLAPTL IPAAVLAAKC LAETHQVRRA MKVIEAAWQA QPHPDLAAAY 
ANIKPGDPAN IRLARVQNLI AKNPADFESA LAIARAGIDA GEFSRARRAL QPFIDNPTQR 
VAMLMAEIEH GERGDTAKAR AWTLRAVRAL PDAMWTADGY TSDHWRPVSP VTGRLDAFQW 
QVPIAALPAR KAVVIEDNPF HDALIASSAT EALPAANAHD PVTVTIESVV ETTVVAPKQA 
EATVVTVEPE AAADKPKDQK GSSRGGATKD AGKSAPEAPV AASETVIAMP STPLFHRRPS 
QATPPVIPIV RAPDDPGVDE EAAPGDFTEQ SAAPAGQTGN WRGYRPPR