Gene Rpal_3781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3781
Symbol
ID	6411459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4063752
End bp	4065185
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	62%
IMG OID	642713662
Product	O-antigen polymerase
Protein accession	YP_001992755
Protein GI	192292150
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGATA GGACCTCTCC GATTGCTTCG GCAGTGGATG CGGGCGCAAA GCCCTCCCAC 
GCCGAAGCTG TCCGGAGGGC TCAGCTTGGG CTCACCCTCG CCGCATTTGC ACTGGCGCCG 
CTGCCATTCG GTTCCGTCGA TACGATCTGG GTGCTGGCTT GGGTGGTTGT GCTGTCGCTC 
AGCCTGCTCG GGCGACCGCT GCGACCGGTT TCCCGTGCCC AATTCCATAT CCTGATTGCA 
TTTTTGATCG TCTGCGCCAC GTACCTCGTT GTGGCAACGA TCCAGATCGT CCCCGGCCTA 
TCGGTCGGAC CGAACTCGGC AGCGTGGCAG AGGGCAGGCG AACTCATCCA TCTCCCGATC 
TCGCCGAGAA TATCGGCTCG CGCTGAGATC CCTGTCGTAA CTGCCGGGCA TTACCTACTT 
CTGGTCACCT CGGTCCTGGC GGGCTTCTGG GTCGGAACCT CGAGAAGCAA CGCGGAGACA 
CTGTTCAAGG TCGCCCGCTA TTCGATCCTG CTTTATGCGC TATATGGCCT GCTGGCTCGG 
GCGTTCACGC CGGGGTTGGT TCTTTGGCAG CCGAAGACGG CCTATCAGGG CGATCTGACG 
GCCACCTTCA TCAATCACAA TACCGCAGCC GCCCTGCTTG GCGCCGGGGT GATCTTGTGG 
GCCTGTTCGA TCCAGCAGCA GCTTAGGTTC ATCGGCCCGC TTTCGTTTCG ACTGTTGATG 
CTCAGCCCGT CCAATGAAGC GGTTGGGATC CAGATTGCCA CCCGGGCCGC GGCAGGCCTG 
CTGTGTTTCC TCGCGCTGCT CTCAACGGGC TCTCGCGCGG GCCTCGCATG TGCCGTTCTC 
GGGCTTTTCG CGGCGATCCT TCAGATGGTT GCCGGGCAGC TTCGGCTTCG GCTCGTCTAT 
GGTCTGTTGA TCGCGGCTGT AGGCTTGGTC GTGATCGCGC TGTGGCTGGC GCAAAGTCAG 
AGTGTCATGA CGCGCGGCAT GTTCGATGAA GGCCGGTGGA TGGCCTACAA GCATGCTCTC 
CGGGTGATTG TCGAAAACCC GATCTTGGGC ATCGGGGCCG GAGCGTTTGG AGACGTGTTT 
CCCGCCTTTC GGGGAGACGA TATGTCGATG TGGGGCGTCT GGGACTACGC CCATTCCACA 
CTCGTCGAAA TCGCCGTCGA AATGGGGCTT CCAATCGCAT TACTCGTGTG CGTCTCGGCG 
GTTGTCTCGC TGGTGGTTGT GGCGCGAGCC GGCACGCGCT CAGTCGGGCA CAGTCGGACC 
TTCCTGTGTG CCATCAGCGG CATCATGGTG ATGACCTACC TTCATTCGCT GATCGACTTT 
CCGCTGCAGG TCCCCGGCTA CTCGATCCCC TTTGGAATCC TGGTCGGTTG TGGACTCGCT 
TTGGCCACGC GGGAACGTGG AGCGGAGAGG GACGAGGCCG TCGGGTATCG CTGA

Protein sequence

MTDRTSPIAS AVDAGAKPSH AEAVRRAQLG LTLAAFALAP LPFGSVDTIW VLAWVVVLSL 
SLLGRPLRPV SRAQFHILIA FLIVCATYLV VATIQIVPGL SVGPNSAAWQ RAGELIHLPI 
SPRISARAEI PVVTAGHYLL LVTSVLAGFW VGTSRSNAET LFKVARYSIL LYALYGLLAR 
AFTPGLVLWQ PKTAYQGDLT ATFINHNTAA ALLGAGVILW ACSIQQQLRF IGPLSFRLLM 
LSPSNEAVGI QIATRAAAGL LCFLALLSTG SRAGLACAVL GLFAAILQMV AGQLRLRLVY 
GLLIAAVGLV VIALWLAQSQ SVMTRGMFDE GRWMAYKHAL RVIVENPILG IGAGAFGDVF 
PAFRGDDMSM WGVWDYAHST LVEIAVEMGL PIALLVCVSA VVSLVVVARA GTRSVGHSRT 
FLCAISGIMV MTYLHSLIDF PLQVPGYSIP FGILVGCGLA LATRERGAER DEAVGYR