Gene RPB_0696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0696
Symbol
ID	3908202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	782939
End bp	784159
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	66%
IMG OID	637882588
Product	hypothetical protein
Protein accession	YP_484318
Protein GI	86747822
COG category	[I] Lipid transport and metabolism
COG ID	[COG1960] Acyl-CoA dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.103838
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCACA TGAATGTGTC CAAGGGCGAA TCCTGGAGCG GGTCGCGCGC GTCCGACTTC 
GACTACAGGG CCGCGGCTCG CGCGATCCTG CCACGCCTGG CCGCGACGTC GGACAGCAGC 
GAGCGCCTGC GCAGGCTGGA CGACGATGCC GCCGCGGCAC TCCGCGGATC GGGCCTGGCC 
CGCGTTCTGA CGCCGAAGAA ATTCGGCGGC TTCGAGCTCT CCCCAAGCGC CCACATCTGG 
ACCTGTGCGG AACTCGCCCA GGGCTGTTCG GCCGCAAGCT GGGTGTTGAT GGTTTGTGTG 
GCCCACGACT ACATCGTCGG ACGGTTCTCG GAAGAGTGCC AGAAGGAAGT CTATGACGGC 
GACGCCGACA ACCTGCTCGC CGGCGCCCTG GCTCCGCAGG GCACGATCGA ACGCACCGCC 
GGCGGTTGGC GTCTCAATGG GCGTTGGCAA TTCGGCAGCG GCTGCGACCA TTCTCCCTGG 
TTCATTCTCG GCACCAAGGT GGTCAATCCG GACTCGGGCG GCTATCTCAA CTACCATGTG 
ATGGTGCCGC GGGCGGACAT CGAGATCGAC GATACGTGGT ACACGCTCGG CATGCGCGGA 
ACAGGATCGA AAGATCTCGT CGCACGCGAT GTGCTCGTGC CCGACTATCG GGCGATGCCG 
ACCTATCCGA CCTTCATGGG GTCGACCCCG CATACGAACA GTCCCGTCTA TCGCTTGCCC 
GTCTATGCCG GTCTTTCGTC GATGCTGTCG GGCACCGTGC TCGGGATGGC GGAGCGCGGC 
TTGAAGCACT TCATCGAGCG GACCTCCGCC CGCAGGACCG CCCATGGCGT ATCGAAGGCG 
GAGAACGCCA ACATGCAACA ACGAGTGGCG GAGTCGACGG CCGAAGTCGC CGCCGCCCGG 
CGGCTGCTGG AAAACATCTG CGAGCGCTTC GATCAGGCGA TGGTTGCCGA CCAGGGGCCG 
ATGTCCGCCA GCGACCGCGT CCAGTTCCGG TGGGACGCGG CCTATGTCGT CGAACTGAGC 
CGACGGGCGA TCGATCGGGT GTTCGCCGCT TCCGGCGCAC ACGGAGTCTA CGAGGGCAGC 
CCGGTGTATC GCGCCTACCG CGATATCAAC ACGGCCTGCC ATCACGCGGT GATCGACTTC 
GACACGGTCT CTGGATTACG CGGGCAGATC GCCCTGCTCG GCGACATCGG CGAGAACCCC 
CGTTCGGTGC CTCTCGCCTA G

Protein sequence

MNHMNVSKGE SWSGSRASDF DYRAAARAIL PRLAATSDSS ERLRRLDDDA AAALRGSGLA 
RVLTPKKFGG FELSPSAHIW TCAELAQGCS AASWVLMVCV AHDYIVGRFS EECQKEVYDG 
DADNLLAGAL APQGTIERTA GGWRLNGRWQ FGSGCDHSPW FILGTKVVNP DSGGYLNYHV 
MVPRADIEID DTWYTLGMRG TGSKDLVARD VLVPDYRAMP TYPTFMGSTP HTNSPVYRLP 
VYAGLSSMLS GTVLGMAERG LKHFIERTSA RRTAHGVSKA ENANMQQRVA ESTAEVAAAR 
RLLENICERF DQAMVADQGP MSASDRVQFR WDAAYVVELS RRAIDRVFAA SGAHGVYEGS 
PVYRAYRDIN TACHHAVIDF DTVSGLRGQI ALLGDIGENP RSVPLA