Gene RPB_3561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3561
Symbol
ID	3911363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4076950
End bp	4078191
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	67%
IMG OID	637885463
Product	secretion protein HlyD
Protein accession	YP_487167
Protein GI	86750671
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.398677
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGAAAC ACGTTACGCG AAGGCTGCGA CGTGTGACGC GGAAGCGGCT GGTGCTGACC 
GGCTGCCTGG TCGTCGGCGT CGCCGTGGCC GGCTCCATCG TCGCGGACCG CTACGCAGCC 
ACCGAGGTCC ATTCGGAGAT CTCCAGCCAG TCGCGTCGCA GCGCCGATCG CTACACCCCG 
AGCGCGGCGG AATGGGCGAG CCTGACCATC GAGAAGGTGA GCGATTTCAG CTTCCGCGCC 
GAGCACGTCA CCGAAGGCAA GATCGCCATC GACGAGGATC GCTCGACGCC TGTGTTCTCG 
CCTTATGCGG GTCGGGTGAC GAAACTGCTG GCGCGCCCCG GCGATCATGT CGTGCAGGGT 
CAGCCGCTGT TCACGATCGA GGCGCCGGAC ACGGTGCAGG CGCAGAACGA TTTCATCGTC 
GCCTCCACCG CGCTGAACAA GGCGAAGTCG CAGCTCGAAC TGGCGCAGTT TCAGGACAAG 
CGTGCGCGCG ATCTGTTCGA CGGCAAGGCG GTGCCGCTGA AGGACTATCA GCAGGCCCAG 
GCGACGCTGA CGAGCGCGCA GAACGACATG CAGTCGGCGA CCACGGCGCT CGAAGCCGCG 
CGCAACCGTT TGCGGATCCT CGGATTGACC GAGAGCGCGA TCACGGCGTT TCAGGACAAG 
GGCAGGATCA ATCCGGAGAC GACGATCTAC GCGCCGATCG CCGGCACGGT GGTGCAGCGC 
AAGATCGGCC CCGGGCAATA CGTCAATGCC GGCGCCAGCG ATCCGGTGTT CGTGATCGGT 
GACCTGTCGA CGGTGTGGCT CACCGCCTTC GTCCGCGAGT CCGAGGCTGC CGACGTCGAG 
GTCGGCCAGG ACATCAGCTT CCAGGTGCTG GCACTGCCCG GCCGCACGCT GACCGGCCGC 
ATCAACTACG TCGCCGCCGC GATCGACCCC GCCACGCGCC GGCTGATGGT TCGCGCCACC 
ATGGACAATC CCGACGGCGC GCTGAAGCCG GAAATGTTCG CCAATGTCAC GATCTACTCG 
GCGTCCGACC ACCCCGCAGT CGGCGTGCCG CGCACGGCGC TGATCTACGA GGGCGACCAG 
GTCCGGGTCT GGGTCGCGCG CGACGACCGC TCGATCGAGC TGCGCACCAT CAAGCCGGGG 
CTCACCGCGG GCAATCTGGT CGAAGTGATC GGCAATCTGC AGCCGGGCGA AAAGATCGTC 
ACCAAGGGCG CCCTGTTCAT CGATCGCGCG GCGACCGGTT GA

Protein sequence

MWKHVTRRLR RVTRKRLVLT GCLVVGVAVA GSIVADRYAA TEVHSEISSQ SRRSADRYTP 
SAAEWASLTI EKVSDFSFRA EHVTEGKIAI DEDRSTPVFS PYAGRVTKLL ARPGDHVVQG 
QPLFTIEAPD TVQAQNDFIV ASTALNKAKS QLELAQFQDK RARDLFDGKA VPLKDYQQAQ 
ATLTSAQNDM QSATTALEAA RNRLRILGLT ESAITAFQDK GRINPETTIY APIAGTVVQR 
KIGPGQYVNA GASDPVFVIG DLSTVWLTAF VRESEAADVE VGQDISFQVL ALPGRTLTGR 
INYVAAAIDP ATRRLMVRAT MDNPDGALKP EMFANVTIYS ASDHPAVGVP RTALIYEGDQ 
VRVWVARDDR SIELRTIKPG LTAGNLVEVI GNLQPGEKIV TKGALFIDRA ATG