Gene RPC_3629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3629
Symbol
ID	3970644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4035973
End bp	4037307
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	65%
IMG OID	637926737
Product	carbohydrate-selective porin OprB
Protein accession	YP_533483
Protein GI	90425113
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3659] Carbohydrate-selective porin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.419401
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00176786
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGCTACA CGCGACATAG AAATTTCACC ACGCCGCGCG CTTGTGCCAC GGCATTGTTG 
GCGACCGGTT TGCTGGCCGG CGGCCTGGTC ACCGCCAGCG CGCAAGAGAA GAGCCTGGAA 
GAGCGCGACA AGCTCACCGG CACCTGGGGC GGCGCCCGCA CCGCGCTGGA AGACAAGGGC 
ATCGAGATCG GCGTTGTCTA TATCGGCGAA GTGCTCGGCA TCTCGGGCGG CGCCAAGCCC 
GCCGGCGGCA CCCATGCCAC CTATGAGGGC CGTCTCGACG TCACCATCAA CACCGACCTG 
GAGAAGCTGG TCGGCTGGGC CGGCGCCAAG ACCCATGTCC GCGCCTTCCA GATCCACAGC 
GCGCAGGGCC AGAACGCCGC CAACTATGTC GGCTCGATCG CCGATCCCAG CAACATCGAT 
GCCTACGGCA CCACCCGGCT GTTCACCGCC TGGTTCCAGC AGGAGTTCGG TACTTGGGGC 
TCGATCCGCC TCGGCCAACT CGCCGGCGAC GACGAATTTC TGGTCAGCAC CACCGCGGGC 
GGCCTGATCA ACGGCACCTT CGGCTGGGCC GCGATCATGG CGGCGAACCT TCCGAGCGGT 
GGCCCGGCGT ATCCGTTGGC CACGCCTGGC GTGCGGCTGC AGGTCAATCC GACCGAGAAC 
ATCTCGCTGC TCGGCGCGGT GTTCGCCGGC GATCCGGCGG GCAAGAATTG CACCAGCGGC 
AACCAGCAGC GCGATTGCAA CCGTTTCGGC ACCACTTTCA GTCTCGACGG CGGCGCGTTC 
TGGCTCGGCG AGGCGCAGTA CAATTTCAAC CAGGACAAGG ATGCCACCGG GTTGGCCGGC 
TCCTATAAAG TCGGTGCCTG GTATCACACC GGCGATCGCT TCCTTGATCA ATACTATCAG 
AGCAATCGCA GCACCGACTG GGGCATGTAC GGCGTGGTCG ACCAGATGCT GTGGCGCGGC 
AAGGACGCCA GCACCAGCAT CTTTGTCCGC GGCGGCTGGA CGCCGTCCGA TCGCAATGTG 
GTTTCTTGGT ACATCGACGG CGGCGTCGGC TTCAAAGGCT TCGTCCCGGG GCGCGAGGCC 
GACACTCTGA CCATCGGTGT GGCGCATTCC AAAATCAGCA GGGAGGCGGC TGCTTACAGC 
TTCGACAACT CCGCTTTGCG GCGTACCGGC GAAACCGTGC TCGAGGTCAG CTACATCGCC 
CAGGTCAATC CGTGGTGGAC CGTGCAGCCG GACTTCCAAT ACATCGCCAA GCCGGCGGGC 
GGCGCACTCC GCGACGACGG CTCGGTGGTC GACGACGCCT ATGTGTTCGG CGTCCGGACC 
ACGATCACGT TCTGA

Protein sequence

MSYTRHRNFT TPRACATALL ATGLLAGGLV TASAQEKSLE ERDKLTGTWG GARTALEDKG 
IEIGVVYIGE VLGISGGAKP AGGTHATYEG RLDVTINTDL EKLVGWAGAK THVRAFQIHS 
AQGQNAANYV GSIADPSNID AYGTTRLFTA WFQQEFGTWG SIRLGQLAGD DEFLVSTTAG 
GLINGTFGWA AIMAANLPSG GPAYPLATPG VRLQVNPTEN ISLLGAVFAG DPAGKNCTSG 
NQQRDCNRFG TTFSLDGGAF WLGEAQYNFN QDKDATGLAG SYKVGAWYHT GDRFLDQYYQ 
SNRSTDWGMY GVVDQMLWRG KDASTSIFVR GGWTPSDRNV VSWYIDGGVG FKGFVPGREA 
DTLTIGVAHS KISREAAAYS FDNSALRRTG ETVLEVSYIA QVNPWWTVQP DFQYIAKPAG 
GALRDDGSVV DDAYVFGVRT TITF