Gene Rpal_4323 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4323
Symbol
ID	6412007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4650612
End bp	4651829
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	67%
IMG OID	642714205
Product	VWA containing CoxE family protein
Protein accession	YP_001993294
Protein GI	192292689
COG category	[R] General function prediction only
COG ID	[COG3552] Protein containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCGTA ATCCGACCGC GATGATCGAC CATCTCAATC CGCCAACCGG CAAGATGGCG 
GACAATGTGG TCGGCTTTGC GCGGGCGCTG CGCGCGGCGG GGCTGCCGGT CGGACCGGGC 
GCGGTGATCG ATGCGCTGGA CGCGCTGCAG CTGATCGAGA TCGGCCATCG CGACGATCTC 
TACGCCACGC TGGAAGCGAT CTTCGTCAAG CGCCGCGAAC ATCTGTTGAT CTTCGACCAG 
GCGTTCGCGC TGTTCTTCCG CGCCGCCGAG GATTGGCAGC ACATGCTGGA CTCGATCCCG 
CTGCCGGACG CCGCCAAGAA AAAGCCGCCG CCGGCCTCGC GCCGGGTGCA GGAAGCGATG 
TCGCCGGCGG CGACGCGCGA CATGCCGTCG GCCGAGGAGC AGGAATTGCG GCTCGCCGTC 
TCCGACAAGG AAATCCTGCA GAAGAAGGAC TTCGCGCAGA TGAGCGCGGC GGAGATCGCC 
GAGGTGACCC GCGCGATCGA ACGGATGAGG TTGCCGCAGG CCGAGCTGCG CACCCGGAGA 
GTGAGGCCCG ATCGTCGCGG CCTGAAGCTC GACCTGCGCC GCACCTTGCG CGCGTCGTTG 
CGGACCGGCG GCGAGGTCGT CGATATCAAG CGGCTCGGTC TGATCGACAA GCCAGCGCCG 
ATCGTCGCGC TGCTCGATAT CTCCGGGTCG ATGAGCGAAT ACACGCGGCT GTTCCTGCAC 
TTCCTCCACG CCATCACCGA TGACCGCAAG CGGGTGTCGA CCTTCCTGTT CGGCACAAGG 
CTGACCAACG TCACCCGTGC GCTGCGGCAG CGCGATCCGG ACGAAGCGCT GGCGAGCTGC 
ACCTCCTCGG TCGAGGACTG GGCCGGCGGC ACGCGGATCG CCACCTCGCT GCACAGCTTC 
AACAAGCTGT GGGCGCGGCG GGTGCTCGGC CAAGGTGCGA TCGTGCTGCT GATCTCCGAC 
GGGCTGGAGC GCGAGAGCGA CTCCAAGCTG GCGTTCGAGA TGGACCGGCT GCATCGCTCC 
TGCCGCCGGC TGATCTGGCT CAATCCGCTG CTGCGCTACG ACGGTTTCGA GCCGCGCGCC 
CAGGGCATCA AAATGATGCT ACCCCACGTT GACGAATTCC GCCCGGTGCA TAATTTGACC 
TCGATGCACA CGCTGATCGC GGCGCTGTCG TCGGCACCGC CGCCGCACCA TTTCAGCACG 
ATCCGTTCCG TCGCCTGA

Protein sequence

MQRNPTAMID HLNPPTGKMA DNVVGFARAL RAAGLPVGPG AVIDALDALQ LIEIGHRDDL 
YATLEAIFVK RREHLLIFDQ AFALFFRAAE DWQHMLDSIP LPDAAKKKPP PASRRVQEAM 
SPAATRDMPS AEEQELRLAV SDKEILQKKD FAQMSAAEIA EVTRAIERMR LPQAELRTRR 
VRPDRRGLKL DLRRTLRASL RTGGEVVDIK RLGLIDKPAP IVALLDISGS MSEYTRLFLH 
FLHAITDDRK RVSTFLFGTR LTNVTRALRQ RDPDEALASC TSSVEDWAGG TRIATSLHSF 
NKLWARRVLG QGAIVLLISD GLERESDSKL AFEMDRLHRS CRRLIWLNPL LRYDGFEPRA 
QGIKMMLPHV DEFRPVHNLT SMHTLIAALS SAPPPHHFST IRSVA