Gene Rsph17029_1894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1894
Symbol
ID	4897469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2006963
End bp	2008363
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	69%
IMG OID	640112488
Product	TolC family type I secretion outer membrane protein
Protein accession	YP_001043770
Protein GI	126462656
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID	[TIGR01844] type I secretion outer membrane protein, TolC family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.170185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.445756
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAGA TCAGACTGTG GGCCGTGGCG ACCTGCTCGG CTCTGGCGGT GATGGCCTCG 
TCCGCGGCAC AGGCGGAGAC GCTCGCCGAC GCCCTCATCT CCGCCTACCG CAACAGCAAC 
CTGCTCGAAC AGAATCGCGC GCTTCTGCGG GCGACCGACG AGGATGTGGC GGTGGCCGTC 
GCGGCTCTGC GCCCCGTCGT GCAGTTCGTC GCGCAATCGA CCTACAGCTT CCAGCGGGTT 
CATGCGGATG CGACGCTCCT GACCCCTGCC GGGCGGACCA ATGTCGAGAA CCTGAACTCC 
TCGGTCGGGC TCACCGCCTC GATGACGCTC TATGACTTCG GGCGCAATGC GCTCGCCGTC 
GAGGCCGCCA AGGAGACGGT GCTCGCCACC CGCGAGGCGC TGGTGCAGGT CGAGCAGAAC 
GTGCTGCTCG ATGCGGTCAA TGCCTATGTG CAGGTGCAGC TTGCGCAATC CATCGTCAAT 
CTGCGGCGCA ACAACCTCGG GCTGATCGAT CAGGAACTGC AGGCGGCGCA GGACCGGTTC 
GACGTGGGCG AAGTCACCCG CACCGACGTG TCGCAGGCGC AGGCCGCGCT GGCGGCCTCG 
CGGTCCGACC TGACCTCGGC CGAGGGCGAT CTCAAGGTGG CGCGCGAGGC CTACAAGGCC 
GCCGTGGGCC ATTATCCGGT CGATCTCGCG CCGCGTCCTG CCGCGCCGCG CACCGCCGCG 
ACCATGGAGG CGGCGCGTCA GGTGGCGCTC CGCGCCCATC CGCAGGTGCG CCAGGCCCAG 
CGTCAGGTGG CGGCGGCCGA CCTGAACGTG GCGCGCGCCA AGGCCGCGAT GCGGCCTTCG 
ATCAGCGCCG AGGCGAATGT GGGGCTCGAC GACGAGGGGC AGGAGTCGGC CAGCGTCGGC 
CTCTCGCTCC GGCACACGCT TTATGCCGGG GGCGAGCTGT CCGCGCTTTA CCGCCAGACG 
CTTGCCAACC GCGATGCGCA GAAGGCGAAC CTGCTGCAGA CCGGCGTGAA TGTGGCGCAG 
AATGTGGGCG TCGCCTGGTC GACGGTCGAG GTGGCCTCCG CCGCCATCGC CGCGGGGGAC 
GAGGAAGTCC GCGCTGCCCG CACCGCCTTC GAGGGCGTGC GCGAGGAAGC GACGCTCGGT 
GCCCGGACCA CGCTCGACGT GCTGAACGCC GAGCAGGACC TCCTGAACTC GCAGGCCGAC 
CGTCTCACCG CCGAGGCGCA GCGCTATGTC GGGATCTATC AGGTGCTGGC CTCGATGGGG 
CTCCTGACCG TCGAACATCT CAATCTGGGT ATCCCGACCT ACGATCCGGC AGCCTACTAC 
AACGCCGTGA AGCACGCGCC GGCCACCAGC TCGCAGGGCA AGCGGCTCGA CCGCGTGCTG 
AAGTCGATCG GCCGGAACTG A

Protein sequence

MRKIRLWAVA TCSALAVMAS SAAQAETLAD ALISAYRNSN LLEQNRALLR ATDEDVAVAV 
AALRPVVQFV AQSTYSFQRV HADATLLTPA GRTNVENLNS SVGLTASMTL YDFGRNALAV 
EAAKETVLAT REALVQVEQN VLLDAVNAYV QVQLAQSIVN LRRNNLGLID QELQAAQDRF 
DVGEVTRTDV SQAQAALAAS RSDLTSAEGD LKVAREAYKA AVGHYPVDLA PRPAAPRTAA 
TMEAARQVAL RAHPQVRQAQ RQVAAADLNV ARAKAAMRPS ISAEANVGLD DEGQESASVG 
LSLRHTLYAG GELSALYRQT LANRDAQKAN LLQTGVNVAQ NVGVAWSTVE VASAAIAAGD 
EEVRAARTAF EGVREEATLG ARTTLDVLNA EQDLLNSQAD RLTAEAQRYV GIYQVLASMG 
LLTVEHLNLG IPTYDPAAYY NAVKHAPATS SQGKRLDRVL KSIGRN