Gene RPB_0171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0171
Symbol
ID	3907776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	185450
End bp	186520
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	69%
IMG OID	637882053
Product	secretion protein HlyD
Protein accession	YP_483794
Protein GI	86747298
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGTA GCTGGATGCG TTGGGTCGTG ATCGTCGCCG TGGTGGCGGT TGCGGGTGGA 
GGTTACTTCG CGTGGCGAAC GTTCGGCGCC AAGGGGTTGC CGCCCGGCAT CGCCAGCGGC 
AACGGCCGGA TCGAGGCGAC CGAGATCGAC GTTTCCACGA AGTCGGCCGG CCGCATCCGC 
GACATTCTCG TGCGCGAGGG CGATTTCGTC ACCGCGGGTC AGGTGCTGGC GCGGATGGAT 
ACGGATCAGC TCGAGGCGCA GCGCCGCCAG GCGGAGGCGC AGTTGCGGCG GGCCAGCATC 
GGCATCGAGA CCGCGACCAG CCTGGTCACG CAGCGCGAAG CCGAGCGTGA GGCGGCTGTC 
GCGGTGATCG CGCAGCGCGA CGCCCAGCTC GACGCGCTGG AGCGCAAGCT GGCGCGCGCC 
GAAGCGCTGA TCAAGACCAG CGCGGTGTCG CAGCAGGTGC TGGACGACGA CCGCGCCAAC 
GAGCAGGGCG CGAAGGCCGC GGTCGCCGCC GCCAAGGCGC AGCTCGCGGC CAGCGAGGCG 
GCGATCAGCT CGGCGAAAGC GCAAGTGATC GACGCCGGCG CGGCGGTCGA CGCCGCCAAG 
GCCGCGATCG ACAGCATCAC TGTCGAGATC AACGACAGCA CGTTGAAATC GCCGCGCGAC 
GGCCGCGTGC AATATCGCGT CGCCCAGCCC GGCGAAGTGA TCGCCGCCGG CGGGCGCGTG 
CTGAATCTGG TCGATCTCAG CGACGTCTAC ATGACCTTCT TCCTGCCGAC CGCGCAGGCC 
GGGCAGATCG CGATCGGCGC CGATGTGCGT CTGGTGCTCG ACGCGCTGCC GCAGGTGGTG 
ATTCCGGCGA AGGCGACCTT CGTCGCCGAC ACCGCGCAGT TCACGCCGAA GACGGTGGAG 
ACCGAAGAGG AACGGCAGAA GCTGATGTTC CGGGTCAAGG CGCACATCCC CCAGGAGCTG 
CTGCGCAAGT ACATCCAGCG CGTCAAGACC GGACTGCCGG GCGTGGCCTA TATTCGGCTC 
GATCCGAAGG CCGAATGGCC GGCCAATCTC AGCGGCACGC TGGCGCAATG A

Protein sequence

MASSWMRWVV IVAVVAVAGG GYFAWRTFGA KGLPPGIASG NGRIEATEID VSTKSAGRIR 
DILVREGDFV TAGQVLARMD TDQLEAQRRQ AEAQLRRASI GIETATSLVT QREAEREAAV 
AVIAQRDAQL DALERKLARA EALIKTSAVS QQVLDDDRAN EQGAKAAVAA AKAQLAASEA 
AISSAKAQVI DAGAAVDAAK AAIDSITVEI NDSTLKSPRD GRVQYRVAQP GEVIAAGGRV 
LNLVDLSDVY MTFFLPTAQA GQIAIGADVR LVLDALPQVV IPAKATFVAD TAQFTPKTVE 
TEEERQKLMF RVKAHIPQEL LRKYIQRVKT GLPGVAYIRL DPKAEWPANL SGTLAQ