Gene Saro_0246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0246
Symbol
ID	3917597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	254975
End bp	256591
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	69%
IMG OID	640442973
Product	Type I secretion outer membrane protein, TolC
Protein accession	YP_495528
Protein GI	87198271
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID	[TIGR01844] type I secretion outer membrane protein, TolC family

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGCCAA AGGCGAACGG CGGCGTGGCA TGGCTGGCTC TGCTTCTGGC GGAAACAGCC 
ACAGGCACCG TCGTATCCAC AGTCGCACCC ACCGTCGCCC GGGCGCAGGA GATCGCGAGC 
ACTTTCGTCG AGGCGCCGGA ACTGCCACCC GAAACCCCGT CCGACATCGC CGACCAGTTG 
CGGGAACCGA CCCCCGTGGC GGCCCTGCCG GACGCGCTGC GCCGTGCCTA CTGGTCCAAT 
CCCAGCCTTC AGGCCCAGCG CGCATCGGTA CGCGGGGCGG ACTGGCGCAT TCCCCAGGCC 
CGCGCCGCCT ATGGACCCAA GCTCAGCGCA TCGGGCACCT ATGGCTGGCA GCGCGACAAC 
TTCGAGACCC CGGCGGGCGT CTATACCGCG TTCAATGGCT GGACGAGCAC GGCACAGGCG 
ATCCTCACGC AGCCCCTGTT CACCTTCGGG CGAAATGTCG CGGCCGAACA GTTCGCGTCC 
GCGCAAGTGG AATACCAGCG CAACGTCCTG CGCTCGACCG AGCAGCAGAC CATGCTCGAT 
GCGATTGGCG CCTATGTCGG CGTGCTGCGC GACCGCGCCG CCGTGGGCAT CGCGCGCGAC 
AACCTTGCGC TGCTCGAACA GGAGCTTTCC GACAACCAGG CCCGCTTCAA CGCGCGCGAG 
GTGACGTCGA CCGACGTGCA GCAGGTGGAA ACCCGCGTCG ATCTGGGCCG GGCACAATTG 
CTCGCCGCGC AGCGTGCCGC CGCCGGAAGT GAGGCCACGT TCCTTCGTAC CACCGGTGCG 
CCGGCCGCCG AGAATGCCGC CGCGCCCAAT CCGTTGAGCC TGCCCGTGCG GACGATCGAG 
GAGGCCTATC TCTTTGCCGA ACTGCACAAT CCCGTGCTGT TCGCGGCCCA GGCGCGCGAG 
AAGGTTTCGC GGGCCCAGGC GGCCAGCGCG CGGGCGGACC TGATGCCGCG CGTCGACCTG 
CGCGGATCAG CCGATTACGG CACGCTTTCG CCCTATTCGA ATGCGCTTCG CCAGAACACC 
CTGCGCGGCG AGGTGGTGCT GAGCGCACCG CTGTTCGAAA GCGGCGTGCG CCGCGCGCGT 
CTTGCCGAGG CGGATGCGGC GAACGATGCG GACTGGCGGC TCGTCGATGC GGCCATGCGC 
GAAAACCGCG CCGCGATCGC CGATGCCTGG AGCGAATGGC AGGCGCAGAC CGGGGGCATC 
GCCCGGCTTG GCGAAGCGGT CGAATCCGCG CGCAAGGCCT ATGACGGCGC GCTGCTCCAG 
GAACGTGCCG GTCTGCGGAC CACGCTGGAC GTGCTCGATC TTGCACGGGA ACTGCTTTCG 
GCCCGCAACG GCTACAACAA TGCCATTGCC GGGGCGACAA TCGCCAAGGC GCGCCTGCTC 
TTCGCGATGG GCTCGCTCGA CTATGCGTGG CTGATGCCCG ACGAGGCGCG ATACGATGCG 
GACGGGCACC TGCAGGACGT GCGTCACAAG GGTGACGTGC CGCTGCTCAC CCCGCTGTTC 
CGCGCGCTCG ACAGCGTCGT CGCCGGCGGC GGCAAGCCGC GCCCGCTGCG CGATCCTTCC 
GCCAAGGCGA CCACGTCGGG CTTCACCCTG ACCGAGCAGC CCGCGCCGGG CCAGTAG

Protein sequence

MRPKANGGVA WLALLLAETA TGTVVSTVAP TVARAQEIAS TFVEAPELPP ETPSDIADQL 
REPTPVAALP DALRRAYWSN PSLQAQRASV RGADWRIPQA RAAYGPKLSA SGTYGWQRDN 
FETPAGVYTA FNGWTSTAQA ILTQPLFTFG RNVAAEQFAS AQVEYQRNVL RSTEQQTMLD 
AIGAYVGVLR DRAAVGIARD NLALLEQELS DNQARFNARE VTSTDVQQVE TRVDLGRAQL 
LAAQRAAAGS EATFLRTTGA PAAENAAAPN PLSLPVRTIE EAYLFAELHN PVLFAAQARE 
KVSRAQAASA RADLMPRVDL RGSADYGTLS PYSNALRQNT LRGEVVLSAP LFESGVRRAR 
LAEADAANDA DWRLVDAAMR ENRAAIADAW SEWQAQTGGI ARLGEAVESA RKAYDGALLQ 
ERAGLRTTLD VLDLARELLS ARNGYNNAIA GATIAKARLL FAMGSLDYAW LMPDEARYDA 
DGHLQDVRHK GDVPLLTPLF RALDSVVAGG GKPRPLRDPS AKATTSGFTL TEQPAPGQ