Gene RPD_4401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4401
Symbol
ID	4024926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4869694
End bp	4871373
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	64%
IMG OID	637964610
Product	OmpA-like transmembrane region
Protein accession	YP_571518
Protein GI	91978859
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3637] Opacity protein and related surface antigens
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCAAA TCATTTTTGC TGCGGCCGCT GTGACCCTGG CCGCTGGAAC CGCCGCCGCC 
GCCGATCTGC CGCGATTGCC CCCGGCTGCG CCGGTGTTGT GGAACTGGAC CGGCCTGTAT 
TGGGGCGCCC ATCTCGGCGG CAGCTTCGGC GCGTCGAGCT TCAGCGATCC GGCCGGCCCC 
GGCATCTATG GCGGCAACGT CCGTAGCCCG GCGGCGATGG CCGGCATTCA GCTCGGCTAC 
AACTACCAGC CGAATGCGAA CTGGCTGGTC GGCGTCGAGG CCGACCTCAG CGCGCTGAAC 
GGCAACGGCA CCAATAGCTG CATGGTCTCG TCCGGCCTCG TCATCTCGGC GAACTGCCGC 
GTCCGCCAGG ATGCGATGGC GACCGTGACC GGCCGCGCCG GCCTTGTCAC CGGCCCCGGA 
GGCCGCACGC TGCTTTACGC CAAAGGCGGC GCGGCCTTCC TCAGCGAACG AATAGATATC 
ACCGTCGGAA ATCCGCTCCG CTCCTCGACC GACAATAGCG ACGGCCGCTG GGGATGGACC 
GCGGGCGCCG GCATCGAGCA GGCGCTGGCG CCGGCCTGGT CGGTCAAGTT CGAATATGAC 
TACGCCAATT TCGGCAGCAG CGATGTGGCG ACGCCTGCGA GCTATCGGCT GGTTCCATGG 
GTCGGCTATT TCCCGACGCC GCAGGGAACC AGCAAGGTGA GTCAGGATTT GCACGCGGTG 
AAAGTCGGGC TCAACCTCAA ATTCGGCGGC GATGTCGACG CGCGCTTCGA CGACTATCAT 
CTGCGCGGAA GCCAGGCCGC GAACGAGATC GTCGAGCGCG GCGCAGTCGA GGTCGGCGGC 
CGGGTCTGGT ACAGCTCCGG CCGTTTCCAG AAAGACCTCG GCAACACCGT CGATCAGGGT 
AGCCAGAATC ATCTGATTTC GCGGCTGACC TATCAGAGCA CGGCGGCGTC GGGCGAGGCG 
TTCGGCCGCG TCGATGGTCC CTACGACATG TTCCTCAAGG GCTTCGCCGG CGGCGGAACG 
CTGCTGAGCG GACGCATGAA CGACGAGGAC TGGATTGCCA ATAGAGGCAT CCCGTATTCC 
AACACGCTCC ACGATCCGGT CAAGGGCAGC ATCGCCTATG CGACGCTCGA CCTCGGTTAC 
AATCTGCTGC GCGGACCGGA TTACAAGTTC GGCGGCTTTG TCGGCTACAA TTACTATCGC 
GAGAACAAAT CGGCCTATGG CTGTGCCCAG ACGGCCGGCC CGACGGGGCA GGTCTGTGCC 
GATCCGGTTC CCAACACCGT TCTCGCGATG ACGCAAAACA ATACCTGGCA TTCGCTCCGG 
GTCGGCTTCA ACGGCGAAAT CGGACTCGGC CGCGGGTTGA AGCTCTCCGC CGACGCCGCC 
TATCTGCCTT ATGTGAAGAC CTTCGGTGTC GATAATCACG TGATGCGTAC CGATGTCACC 
GATACTGTAT CGCCGGAACA GGGAACCGGG CAGGGCGTGC AGCTCGAAGC GATCCTGTCG 
TACCAGTTCA ACAATGCCTT CAGCGTCGGT GCCGGCGCAC GCTATTGGGC GATGTGGGCA 
ACCACCAATG CCTACACCAA CATCTTCGGC TCGGAGTGTC CGTGCCAGAC CTTGCCGGAG 
CGCACCGAGC GCTATGGAAC CTTCCTGCAG GCCGCCTACA AGTTCGACAC GCTGAACTAG

Protein sequence

MRQIIFAAAA VTLAAGTAAA ADLPRLPPAA PVLWNWTGLY WGAHLGGSFG ASSFSDPAGP 
GIYGGNVRSP AAMAGIQLGY NYQPNANWLV GVEADLSALN GNGTNSCMVS SGLVISANCR 
VRQDAMATVT GRAGLVTGPG GRTLLYAKGG AAFLSERIDI TVGNPLRSST DNSDGRWGWT 
AGAGIEQALA PAWSVKFEYD YANFGSSDVA TPASYRLVPW VGYFPTPQGT SKVSQDLHAV 
KVGLNLKFGG DVDARFDDYH LRGSQAANEI VERGAVEVGG RVWYSSGRFQ KDLGNTVDQG 
SQNHLISRLT YQSTAASGEA FGRVDGPYDM FLKGFAGGGT LLSGRMNDED WIANRGIPYS 
NTLHDPVKGS IAYATLDLGY NLLRGPDYKF GGFVGYNYYR ENKSAYGCAQ TAGPTGQVCA 
DPVPNTVLAM TQNNTWHSLR VGFNGEIGLG RGLKLSADAA YLPYVKTFGV DNHVMRTDVT 
DTVSPEQGTG QGVQLEAILS YQFNNAFSVG AGARYWAMWA TTNAYTNIFG SECPCQTLPE 
RTERYGTFLQ AAYKFDTLN