Gene RPB_4301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4301
Symbol
ID	3912114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4888903
End bp	4889910
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	69%
IMG OID	637886205
Product	secretion protein HlyD
Protein accession	YP_487899
Protein GI	86751403
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.404032
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATGC GGATTCGCGA CATGATCACG GCCGGTGCCT GCGCCGCCCT CCTGCTCGGC 
GCGGCGGCGA CGCCCGCGGC GGCGGCGACG CTCACGGTGG CGGAGCAGAA GGTCTCGGAC 
GAGAAGGCGG TGTTCGCCAC CGTCGAGAGC ATCAGCGTCG TGCCGGCGCG CAGCCGGATC 
GGCGGCACCG TGATCGCCCT GAAAGTGCGC GAGGGCGACA GCGTCGCCCG CGGCCAGGAA 
ATCGCGACGA TCGGCGACGA CAAGCTGACG CTGCAGATGA ATTCGCTCGA CGCGCAGATG 
CAGGCGCTGC TGGCGCAGGC GTCGCAGGCG CAGATCGATT TCGACCGCAC CAGCGGCCTG 
GTCGAACGCG GCACGCTGGC GCGCACCAAG CTCGACGAGG CGCGCACCAC GCTCAACGTG 
GCCGAGAACA ATCTGCGCGC CAAGACCGCG GAGCGCGCGG TGGTGCAGCA GCAGTTCAAG 
GAGGGCCAGG TGCTGGCGCC CGACGACGGC CGCGTGCTGA AGAAGATGGT CGCGGTCGGC 
TCGGTGGTGC TGCAGGGCGA TACCATCGTC ACGGTGGCGC AGCAGCACTA CAAGCTGCGG 
CTGCGGGTGC CGGAACGGCA CGCGCGGTTC CTCAAACAGG GTGATCGCGT TCGCGTCGAC 
GGCGCCGAGT TCGGCGACCA CACGGCGAAG TTCGGCACGA TTGACCTCGT CTACCCGCTG 
ATCGAGGACG GCCGCGTCGT CGCCGATGCC TCCGTCGAGG GGCTCGGCCA GTATTTCGTC 
GGCGACCGGC TGCGGGTGTG GGTCTCCGGC GGCGAGCGCC CGGCCTTCGT CATTCCGTCG 
CGCTACATCA AGACCGAATT CGGCATCGAC TACGTCCAGC TCGGCGAGCC GGGCAAGACC 
GTCGCGGTGC CGGTGCAGCG CGGCCGCGAT CATCCCACGC CGGACATGCC GGACGGCCTC 
GAGATCCTCT CGGGCCTGCG TAATGGTGAC AGGTTGGTGC AGCCGTGA

Protein sequence

MTMRIRDMIT AGACAALLLG AAATPAAAAT LTVAEQKVSD EKAVFATVES ISVVPARSRI 
GGTVIALKVR EGDSVARGQE IATIGDDKLT LQMNSLDAQM QALLAQASQA QIDFDRTSGL 
VERGTLARTK LDEARTTLNV AENNLRAKTA ERAVVQQQFK EGQVLAPDDG RVLKKMVAVG 
SVVLQGDTIV TVAQQHYKLR LRVPERHARF LKQGDRVRVD GAEFGDHTAK FGTIDLVYPL 
IEDGRVVADA SVEGLGQYFV GDRLRVWVSG GERPAFVIPS RYIKTEFGID YVQLGEPGKT 
VAVPVQRGRD HPTPDMPDGL EILSGLRNGD RLVQP