Gene RPD_1013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1013
Symbol
ID	4021488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1150835
End bp	1152772
Gene Length	1938 bp
Protein Length	645 aa
Translation table	11
GC content	64%
IMG OID	637961204
Product	Outer membrane autotransporter barrel
Protein accession	YP_568152
Protein GI	91975493
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3637] Opacity protein and related surface antigens
TIGRFAM ID	[TIGR01414] outer membrane autotransporter barrel domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.645383
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.106647
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACACG CGCGGACCCG AATTCTGGCA GGCTTCGCTT TCGCGATGGC CGCCTCCGTC 
TCCACCGGCG CCTTGGCCGA ATGTACCGGC ACAGGCAGCT TCGTTCCGGG CGCCGTGATT 
CCGGGCACCA ATTTCAGTCC GAGCGCGCTC TTGCCGTTCG CCGCGGGCGG TGCGGTGAAT 
TCCCTCGTCT CGGCGATCAA CACCGCCAAC ACGGCATTCC TCACCCAATC GACCGCCTTC 
GTGAGCGCCC CGCGCAATCC GGCGCCGAAT CAGGAAGGCG GCGGCGTCTG GACCCGTGCG 
ATCGGCGGTG AAGTCACCAC CAAATCGACC AGCACGACCT CCAACGTGTC GCTCGGGGGT 
GTCGGACTGC CGGGCTCGGT GAACTGCAAC AACGAGAACA AGCTCAGCTT CGCTGGCGTC 
CAGGTCGGGG CGGATACCTC GATTTTGAAC TACAACGGCT GGAATATGCA TCTCGGCTCG 
ACCGTCGGCT ATCTCGGCGC CAAGTCCCGC GACAAGTCGT CGGCCGGTGC GCTGAACCCG 
CTTGGCGGCA CTTTCGAAGA CACGCTGCAG GTGCCGTTTG CGGGCGTCTA TGTCGCGATC 
ACCAAAGGCG GTTTCTTCGC CGACGGCCAG GTTCGCCTCG ATTATTATCA GAACTCGCTG 
AGTGATCCGA TCGTCGGCGG TATCTTCAGC CAGAAGCTGG ATGCCCGTGG CCTCTCCTTC 
ACCGGTAACG TCGGCTACAA CCATGCGTTG GAGAACAACT GGTTCATCGA GCCCTCGGCC 
GGTATCGTGG TCTCGAAGGT CAAGGTCGAT CCGCTCAACG TGACCGGCTC GCTGGTGTTG 
CCCGCGACCT TCACGCCGGG CGTCACGTTC CCCGGCCAGT TGCAGGTCGA CGATATCAAC 
AGCACGCTCG GTCGCCTCAG CTTGCGCGGC GGCACCAGCA TCGCATCCGG CAACATGATC 
TGGCAGCCCT TCGCCATTGC GAGCGTCTAT CATGAATTCA GCGGGGCGGT GACTTCCACG 
TTCAACGGCG ATGCGGCGTT CAACGCGACC GGCATCCCGT CGGCGACCGG CACGATCTCC 
AGCACCAACC TCGGCACCTA CGGCCAGTTC GGGCTCGGCG TCGCCGGCCA GCTCGTCAAC 
ACCGGCCTGC TCGGCTACGT CCGTGCCGAC TATCGCACCG GTGATCATAT CGACGGCTAC 
AGCCTGAACG GTGGCGTCCG CTACCAGTTC GCGCCCGACG CGATCGTCGC TGCGCCGCTC 
TACACCAAGG CCGCGAAGGC TCCGGTGCTG GTCCGCTCGG CCTATAACTG GACCGGCTTC 
TTCATCGGCG GCAGCTTCGG CGCACTGAAT GGCCGGACCG ACTGGACATT CCAGCCGGTC 
GGCACGCGCA CCGATCCGCG TTTCGCCGGC GCGATCGGCG GCGGCCAGAT CGGTTATGAC 
CATCAGTTCG GCAAGTGGGT GGTCGGCGTC GAAGGCAACC TGTTCGCGAC CAACGCCAAC 
GGCGCCCGTC CCTGCCCGAA TGGCGTGTTC TTCACGTGTG AAAACAATGT GAGCTGGATG 
GGCACTGCGA CCGCGAAGCT CGGCTACGCG TTCTGGGACC GCTCGCTCTG GTACGTCCGC 
GGCGGCGGCG CCTTCGGCGA TCTCAAGGTC ACCACCAACT GCAACACCGG TCCGGTGGTT 
CCCAATCCGG CATTCCTCGT CGTGGCGGGT TGCGGCGAAA GCGCCAGCCG CAACCGTGCC 
GGCTGGACCA TTGGGTTCGG TTCGGAGTTC GCGCTGAGCA AGAACTGGAC GGTGCGCGCC 
GAGACCAACT ATTTCGACAT GGGTCGCGAG CGCTACACGC TGCCGACCTC GACCATCGAC 
GTCAAGGAAA ACGGTTTCAT CTCGACCGTC GGCCTCAACT ATCGCTTCGC GCCCACGGCG 
CTGGTCGCAA AATACTGA

Protein sequence

MQHARTRILA GFAFAMAASV STGALAECTG TGSFVPGAVI PGTNFSPSAL LPFAAGGAVN 
SLVSAINTAN TAFLTQSTAF VSAPRNPAPN QEGGGVWTRA IGGEVTTKST STTSNVSLGG 
VGLPGSVNCN NENKLSFAGV QVGADTSILN YNGWNMHLGS TVGYLGAKSR DKSSAGALNP 
LGGTFEDTLQ VPFAGVYVAI TKGGFFADGQ VRLDYYQNSL SDPIVGGIFS QKLDARGLSF 
TGNVGYNHAL ENNWFIEPSA GIVVSKVKVD PLNVTGSLVL PATFTPGVTF PGQLQVDDIN 
STLGRLSLRG GTSIASGNMI WQPFAIASVY HEFSGAVTST FNGDAAFNAT GIPSATGTIS 
STNLGTYGQF GLGVAGQLVN TGLLGYVRAD YRTGDHIDGY SLNGGVRYQF APDAIVAAPL 
YTKAAKAPVL VRSAYNWTGF FIGGSFGALN GRTDWTFQPV GTRTDPRFAG AIGGGQIGYD 
HQFGKWVVGV EGNLFATNAN GARPCPNGVF FTCENNVSWM GTATAKLGYA FWDRSLWYVR 
GGGAFGDLKV TTNCNTGPVV PNPAFLVVAG CGESASRNRA GWTIGFGSEF ALSKNWTVRA 
ETNYFDMGRE RYTLPTSTID VKENGFISTV GLNYRFAPTA LVAKY