Gene RPD_1785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1785
Symbol
ID	4022267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1999861
End bp	2001105
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	67%
IMG OID	637961979
Product	VWA containing CoxE-like
Protein accession	YP_568922
Protein GI	91976263
COG category	[R] General function prediction only
COG ID	[COG3552] Protein containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.23574
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.248193
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTTGCTCA TTCTTTGCTC GATAACTTTG AGCGAGTTCG ACATGCCCAC AATCGATCAC 
CTCAATCCGC CCACCGGCAT GATGGCCGAC AACGTCGTCG GCTTTGCCCG CGCGCTGCGC 
GCCGCCGGGT TGCCGGTCGG GCCCGGCGCG GTGATCGATG CGCTGAACGC GCTGCAACTG 
ATCGAGATCG GCAATCGCGA CGATCTCTAC GCGACGTTGG AGGCGATCTT CGTCAAGCGT 
CGCGAGCACG CGCTGATCTT CGCGCAGGCC TTCGCGCTGT TCTTCCGCGC CGCGGAGGAG 
TGGCAGCACA TGCTGGATTC GATCCCGCTG CCGGATCACG CCAGGAAGAA GCCGCCGCCG 
GCCTCGCGCC GGGTGCAGGA AGCGATGGCG CCGTCGACGA CCCGGGACTT CCCTTCCGCC 
GAGGAGCAGG AAATCCGGCT CGCGGTGTCG GACAAGGAGA TCCTGCAGAA GAAGGACTTC 
GCGCAGATGA GCGCTGCGGA GATCGCCGAG GTCACTCGCT CGATCGCGCG GATGCGGCTG 
CCGCAGGCGG AATTGCGCAC GCGCCGCGTC CGGCCGGACA AGCGCGGTCT CAAGCTCGAT 
CTGCGCCGCA CGCTGCGCGC TTCGCTCCGG ACCGGCGGCG ACATCGTCGA TATCCGCAGG 
CTCGGCCTGA TCGACAAGCC GGCGCCGATC GTGGCGCTGC TCGATATCTC CGGCTCGATG 
AGCGAATACA CGCGGCTGTT CCTGCACTTC CTCCACGCCA TCACCGACGA TCGCAAGCGG 
GTCTCGACCT TCCTGTTCGG CACGCGGCTG ACCAACGTCA CCCGCGCGCT GCGGGCGCGC 
GATCCCGACG AGGCGCTGGC GAGTTGCACG TCGTCGGTCG AGGACTGGGC CGGCGGCACG 
CGGATCGCGA CCTCGCTGCA TGTCTTCAAC AAGGCGTGGG CGCGCCGCGT GCTGGGGCAG 
GGTGCGATCG TGCTGCTGAT TTCCGACGGG CTGGAGCGCG AGGCCGATAG CAAGCTCGCC 
TTCGAGATGG ACCGGCTGCA TCGCTCCTGC CGGCGGCTGA TCTGGCTCAA CCCGCTGCTG 
CGCTTCGGCG GTTTCGAGCC GCGCGCGCAG GGCATCAAAA TGATGCTACC CCACGTTGAC 
GAATTCCGCC CGGTGCATAA TCTGACCTCG ATGCAGGGAT TGATCGAGGC GCTGTCCTCC 
GCGCCGCCGC CGCACCATTT CAGTGCGATC CGCTCGGCCG CATAA

Protein sequence

MLLILCSITL SEFDMPTIDH LNPPTGMMAD NVVGFARALR AAGLPVGPGA VIDALNALQL 
IEIGNRDDLY ATLEAIFVKR REHALIFAQA FALFFRAAEE WQHMLDSIPL PDHARKKPPP 
ASRRVQEAMA PSTTRDFPSA EEQEIRLAVS DKEILQKKDF AQMSAAEIAE VTRSIARMRL 
PQAELRTRRV RPDKRGLKLD LRRTLRASLR TGGDIVDIRR LGLIDKPAPI VALLDISGSM 
SEYTRLFLHF LHAITDDRKR VSTFLFGTRL TNVTRALRAR DPDEALASCT SSVEDWAGGT 
RIATSLHVFN KAWARRVLGQ GAIVLLISDG LEREADSKLA FEMDRLHRSC RRLIWLNPLL 
RFGGFEPRAQ GIKMMLPHVD EFRPVHNLTS MQGLIEALSS APPPHHFSAI RSAA