Gene Saro_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0040
Symbol
ID	3916043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	44243
End bp	45412
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	70%
IMG OID	640442765
Product	secretion protein HlyD
Protein accession	YP_495323
Protein GI	87198066
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTACG AAACGACCAT CGATGCCGAG GGCGCACAGG CGCTGGGATC CCTGGCCGAC 
GGGGAGGACA GCGCAAGCCA ATCGCGGCGC AAGTGGATCA TCGGCGTCGC CGTGGTGCTG 
CTGGTCGTGC TTGCCTGGTG GTTCCTGCAT GGACCGAGCG AGCCGGCCGG TCCGGCGAAG 
ACCCAGGCCC AGGTGGTCAC GGTCGTCGTG CCGGGCAAGA CCGTCATTGC CGGTACCATA 
ACCGCCAGCG GCACGATCGC CGCGCGCCGC GAGATGCCCG TTGGCGTCGC GGGCGAGGGC 
GGACAGATCG TGCAGGTCCT TGTCGACGCG GGCGACTGGG TTCGTGCAGG GCAGGTGCTG 
GCCGTCATCG ACCGTTCGGT GCAGGGCCAG CAGATCGCCA GCCAGGCCGC CAACGTCGAA 
GTTGCGGCGG CTGACGCGCG GCTGGCGCAA GCCAATCTCG ACCGTGCACT CAAGCTGGTC 
GAGCGCGGTT TCATTTCCAA GGCCGACGTC GACCGCCTGA CCGCCACCCG CGACGCGGCC 
GTGGCGCGCG TTCGCGTGGC CCGGGCAAGC CTGGGAGAAC TGGGCGCGCG TGCGGCGCGG 
CTCAACATCG TGGCGCCGGC GGCGGGGCTT GTCCTCACCC GCGCGGCCGA ACCGGGCCAG 
ATCGTCAGCT CGGGTTCGGG CGTGCTGTTC TCGCTTGCCC GCGACGGGCA GATGGAAATG 
CAGGCGCGCC TTGCCGAAGC CGACCTTGCG CGGTTGACAG TGGGCGCCAC CGCCGAGGTG 
ACGCCCGTGG GCACGACCCG CGTCTTCAAC GGGCAGGTCT GGCAGCTTTC GCCGACCATC 
GACCAGCAAT CGCGCGAGGG CATCGCCCGC ATCGCGTTGT CCTATGATCC TGCGCTGCGT 
CCGGGCGGTT TCGCCAGCGC GACGCTGCGT TCGGGCACGG TCACCGCGCC GCTCCTGCCG 
GAATCGGCCA TTCTGAGCGA CGACAAGGGC ACCTTCGTCT ACGTCGTGGG CAGCGACAAC 
AAGGCCCAGC GGCGCGACGT GAAGACCGGC GAGGTCGGCG CGCGCGGCAT TTCGGTGGTC 
CAGGGTCTGG CGGGCAACGA GCGGGTGGTG CTGCGGGCGG GCGGATTCCT GAATCCGGGC 
GACGCGGTCC AGCCAGTCCT CGCCAAGTAG

Protein sequence

MNYETTIDAE GAQALGSLAD GEDSASQSRR KWIIGVAVVL LVVLAWWFLH GPSEPAGPAK 
TQAQVVTVVV PGKTVIAGTI TASGTIAARR EMPVGVAGEG GQIVQVLVDA GDWVRAGQVL 
AVIDRSVQGQ QIASQAANVE VAAADARLAQ ANLDRALKLV ERGFISKADV DRLTATRDAA 
VARVRVARAS LGELGARAAR LNIVAPAAGL VLTRAAEPGQ IVSSGSGVLF SLARDGQMEM 
QARLAEADLA RLTVGATAEV TPVGTTRVFN GQVWQLSPTI DQQSREGIAR IALSYDPALR 
PGGFASATLR SGTVTAPLLP ESAILSDDKG TFVYVVGSDN KAQRRDVKTG EVGARGISVV 
QGLAGNERVV LRAGGFLNPG DAVQPVLAK