Gene Rpal_1001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1001
Symbol
ID	6408656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	1063767
End bp	1065305
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	65%
IMG OID	642710915
Product	UbiD family decarboxylase
Protein accession	YP_001990033
Protein GI	192289428
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGAGCC GCGTCAAACC GCCCTTCCCT GATCTGCGTG CATTTAGTGG CTATCTCGAA 
TCACGCGGAC AGTTGCACCG CATCCGCAAG CCGGTGTCGG TGGTCCATGA CCTCACAGAA 
ATCCATCGCC GCGTGCTGCA TGCCGGTGGC CCGGCACTCC TGATCGAAAA CCCGATCAAG 
GCCGACGGCA CGCCGTCCGA GATGCCGATC CTGGTCAATC TGTTCGGCAC CGTCGAACGG 
GTGGCCTGGG GCCTCGGCAT TTTGCCGGAG AATCTATCGC GGCTCGGCGA GGCGCTCGCC 
GAAATGCGAG AGCCGGCACC GCCGCAGAGC CTGACCGACG CTTTGAGCAA GCTGCCGATG 
GCCAAGGCCG CGCTGGCGAT GCGGCCGAAG CTGGCGAAAT CGGCGCCGGT GCAGGAAGTG 
GTGCTGACCG GCGACGCGGT CGATCTCGGT CGGCTGCCGG TGCAGATCCC CTGGCCCGGA 
GAACCGGCAC CGCTGATCAC CTGGGGCCTC GTCTTCACCA AGCCGCCGCC CGGCGCGCAC 
GGCACCGACA ATGTCGGCGT CTACCGGATG CAGGTGCTGG GCAAGGATCG CCTGATCATG 
CGCTGGCTGG CGCATCGCGG CGGAGCCAAG CACCACCACC AGTGGAAGGC CGACAAGCGC 
GAGATGCCGG TCGCGATCGT GATCGGCGCC GATCCGTCGA TGATTCTCTC GGCGGTGCTG 
CCGCTGCCGG AGACGGTGTC GGAGATCAAA TTCGCCGGCC TGCTCGGCGG CGAGCGTCCG 
AGCCTGACGC CGTGCCAGAC CATTCCGATC AGCGTGCCAG CCGATGCCGA GATCGTGCTG 
GAAGGCTTCG TGTCACCGAC CGAGACCGCG CCGGAGGGGC CGTATGGCGA CCACACCGGC 
TATTACAACG CGGTCGAGGA ATTCCCGGTG ATGCGGATCA CCGCGATCAC CATGCGCCGG 
CATCCGATTT ATCTGTCGAC CTATACGGGA CGGCCGCCGG ATGAGCCATC GCGACTTGGC 
GAGGCGTTCA ACGACGTGTT TCTTCCGGTC GCGCGGCGGC AATTCCCCGA GATCGTCGAT 
CTGTGGCTGC CGCCGGAAGC GTGTTCCTAT CGGATCGCCG TCGCCTCGAT CAAGAAACGC 
TATCCCGGCC AGGCGCGCCG GCTGATGATG GGGCTGTGGT CGATGCTGCC GCAGTTCAGC 
TACACCAAGC TCCTGATCAT CGTCGACGAC GACGTCGATG TCCGCGACTG GGCCGACGTG 
ATGTGGGCGG TGTCGACACG CTGCGACACC TCGCGCGACA TGGTGTCGAT CAGCGACACC 
CCGATCGATT ATCTCGACTT CGCCTCGCCG AAATCCGGAC TCGGCGGTAA GCTCGGCATC 
GACGCCACCA ACAAGATCGG CACCGAGACC GAGCGCGAGT GGGGCAAGGT GCTGGAGATG 
GACAAGGACG TGATTGCACG GGTCGATGCG ATGTGGACCA GCCTCGGACT GTCGCCGGAA 
CATCAACCGG CGGCCGGGCA ACGCCGGCTG ATCCGATGA

Protein sequence

MLSRVKPPFP DLRAFSGYLE SRGQLHRIRK PVSVVHDLTE IHRRVLHAGG PALLIENPIK 
ADGTPSEMPI LVNLFGTVER VAWGLGILPE NLSRLGEALA EMREPAPPQS LTDALSKLPM 
AKAALAMRPK LAKSAPVQEV VLTGDAVDLG RLPVQIPWPG EPAPLITWGL VFTKPPPGAH 
GTDNVGVYRM QVLGKDRLIM RWLAHRGGAK HHHQWKADKR EMPVAIVIGA DPSMILSAVL 
PLPETVSEIK FAGLLGGERP SLTPCQTIPI SVPADAEIVL EGFVSPTETA PEGPYGDHTG 
YYNAVEEFPV MRITAITMRR HPIYLSTYTG RPPDEPSRLG EAFNDVFLPV ARRQFPEIVD 
LWLPPEACSY RIAVASIKKR YPGQARRLMM GLWSMLPQFS YTKLLIIVDD DVDVRDWADV 
MWAVSTRCDT SRDMVSISDT PIDYLDFASP KSGLGGKLGI DATNKIGTET EREWGKVLEM 
DKDVIARVDA MWTSLGLSPE HQPAAGQRRL IR