Gene Rpal_3736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3736
Symbol
ID	6411414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	3998902
End bp	4000101
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	69%
IMG OID	642713618
Product	2-alkenal reductase
Protein accession	YP_001992711
Protein GI	192292106
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTCGC TCCCCCCGCA TGCTCCGCCG CCGCCCCCGC GACCGCCCGG ACTTGATCCG 
CTCGCCAGTC AGCAGACGCA GGTCCGAAGG ACGCAGCGTA CCGACCGATT GCTCCGGATT 
GCGATCGTGT GGCTGCTGGT GCTGGCGACG CTCTGGGTGG TGCAGCCTTA TCTCAGCGCG 
CTTTGGTTTT CCGCAGCGGG GCCGCGCACC GTCACGGCAC GCGGCGAGCT GGCGCCGGCC 
GAAAAGGCTA CCGTGGATCT GTTCAAGCAG GTGTCGCCGT CGGTGGTGCA TGTGTTCGCG 
CAGGGCAGCC AGCGGGTGTC GCCATTCGCC GTCCAGCAAG AGGCGCCGGT GCAGTCCGGC 
TCGGGCGTGA TCTGGGATGC CGCCGGCCAT GTCGTCACTA ACAACCATGT CATCCAGAAC 
GCCAGCCAGC TGGGCGTCCG GCTGGCGTCG GGCGAATTCG TCACCGCGCG GGTGGTGGGC 
ACCGCGCCGA ACTACGACCT CGCGGTATTG CAGCTCGAGC GGCCGCACAC GCCGCTGCGC 
CCGATCGCGA TCGGCAGCTC GGAGGATCTG CAGGTCGGGC AGGCGACGTT CGCGATCGGC 
AATCCCTACG GCCTCGAACA GACGCTGACC ACCGGCATTG TCAGCGCGCT ACGGCGGCGG 
CTGCCGACAG CAGCGGCCCA CGAGGTGCGC GGGGTGATCC AGACCGATGC GGCGATCAAT 
CCCGGCAATT CCGGCGGTCC GCTGCTCGAC AGCGCCGGGC GGTTGATCGG TATCAACACC 
GCGATCATTT CCGGCTCCGG CGCCTCGGCA GGCATCGGCT TTGCGATCCC GGTCGATGCG 
GTCAATCGCG TCGTCACAGC CCTGATCACC AACGGCAGCG TGCCGGTGCC GGGCATTGGC 
ATCGTCGCGG CGCGCGAGAC CGAAACCGCG CAGCTCGGCA TCGACGGTGT GGTGATCCTG 
CGCACGCTGC CGGATTCGCC GGCCGCGCAG GCCGGCCTCG AAGGCGCGAC CGACGACGGC 
TATGTCCGCG ACGTTATCAC CGGTGCAAAC GGCTCGGACA TCCACAGCAT GTCGGATCTT 
GCCGCAGCGC TGGAGGAGGC GGGGATCGGT CGCGACGTCA AGCTGACGGT TGAGCGCGAC 
GGACGCGCCC GGACGGTGAC CGTGAAGGTG ACTGATATCT CGCAGCGTCG CCGGACCTGA

Protein sequence

MTSLPPHAPP PPPRPPGLDP LASQQTQVRR TQRTDRLLRI AIVWLLVLAT LWVVQPYLSA 
LWFSAAGPRT VTARGELAPA EKATVDLFKQ VSPSVVHVFA QGSQRVSPFA VQQEAPVQSG 
SGVIWDAAGH VVTNNHVIQN ASQLGVRLAS GEFVTARVVG TAPNYDLAVL QLERPHTPLR 
PIAIGSSEDL QVGQATFAIG NPYGLEQTLT TGIVSALRRR LPTAAAHEVR GVIQTDAAIN 
PGNSGGPLLD SAGRLIGINT AIISGSGASA GIGFAIPVDA VNRVVTALIT NGSVPVPGIG 
IVAARETETA QLGIDGVVIL RTLPDSPAAQ AGLEGATDDG YVRDVITGAN GSDIHSMSDL 
AAALEEAGIG RDVKLTVERD GRARTVTVKV TDISQRRRT