Gene Saro_2383 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2383
Symbol
ID	3915728
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2544608
End bp	2546482
Gene Length	1875 bp
Protein Length	624 aa
Translation table	11
GC content	67%
IMG OID	640445138
Product	hemolysin activation/secretion protein-like
Protein accession	YP_497653
Protein GI	87200396
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2831] Hemolysin activation/secretion protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.418836
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGATC GTCTTGGTGC GCAGCCCGAT TTCGGGGCAG TTTCGGTCGT TCCGGTCAGG 
AGCGTTGGGC GTGGTGCGCA ATGGCTGCGC GGGCGCAGCG CATTGCTGCT GGTCGCGAGT 
GGCGTTGCGT GGTCCGCAAT GGCTTCGGCG CAGACCGTGC CGCCGCAGGG CGTGCAGCCG 
CCGACGCGCG AGGAGATCGA GCGCGGCGTT GCCGAGGGTA CGCTGAAGCG TGGCGGGCCG 
GTTTCGGTCG ATACATCCGA AGTTGAACGG GCCCCGTGCC CGCTGGCTGC CCCCGACTTC 
GCGGGCATCC GCCTGAAGCT GCATTCGGTG ACGTTCACCG GCATGCAGGA AATTCCCGGC 
TTCGACCTTT CCGGCAGCTA TGCCGAGTTC GTCGGGACCG ACCAGCCGGT CGCCGTGATC 
TGCGAGATCC GCGACCGGGC GGCGACTGCG CTACGCCAGG CGGGCTATCT TGCCGCGGTG 
CAGGTGCCGC CGCAGAAGAT CGAGGGCGGG GCGGTCCGGC TCGACGTGCT GCTGGCGCAT 
CTCAAGCGGG TTCAGATCAA GGGCGATGCA GGGGCTTCGG AAGGTATCCT TCTGAAGTAC 
CTGAACAAGC TGACGCGCGA TCCGGTTTTC AACACGCACG AGGCAGAGCG CTATCTTCTG 
CTCGCCAAGG ACGTGCCGGG TCTCGACGTG CGCATGGCCC TTCGGCCGGT CGAAGGTGCG 
CCGGGCGAGG TGATCGGCGA AGTGTCCGTG CGCCGGGTGC CGGTCTATGC CGAGCTTGGC 
TTGCAGAACT ACGGTTCGCG GGCGGTGGGG CGCTACAGCG GTCTGGCGCG GGTCCAGATC 
AACGGCCTGA CGGGCCTTGG CGATGCGACA ACGGCAAGCT TCTTCGCGAC GACCGACCTG 
GAGGAGCAGA AGGTCCTGCA GATCGGTCAC GAAATGCGCC TTGGCGGGGA AGGCTTCTCG 
CTGCGGGGCG ATTTCACCTA TGGCTGGACC AATCCGACGG TGACAGGGGC CGCGTCGGAC 
TTCCACTCGC GGACGCTGTC TGCATCGCTG GAAGGAAGTT ACCCGGTGGT CCGGTCGCAG 
GCCTACAACA TGGCCGTGTC GCTCGGTGCC CAGATCGCGG ACCAGGATCT CGATTTCGGG 
AAGATACCGC TCAACCGCGA CAGACTGCGC GTGCTCTATG CGCGGGTCGA TACCAACGGC 
GTTTCCCGGA AAAGCCTGAC CGGCCGCGAC GGCTTCACAC CGTTCGAACC GCATTGGGCC 
TGGGGACTTT CGCTCGAGGC GCGCCAGGGG ATCGACGTGT TCGGGGCGAC GAAGGGTTGC 
CAGGGCGCGC TGGCGCCGAC CTGCACGGGT TTCGGCAAGG TCACGCCCAG CCGCATCGAG 
GGCACGGCCA AGGGCTTTGT CCTGCGCGCT GCGGGCGTGC TCGACTATCG CCCGGTTCGC 
GGCCTGACGT TGAGCGTCCA GCCGCGGGCG CAGTGGTCGC CGGACAAGCT TCTGTCGTAT 
GAGGAGTTTT CGGGCGGCAA CTATACCATC GGCCGAGGTT ACGATCCGGG CGCGGTGATT 
GGCGACAGCG GGGTTGGGGT GCGCGGCGAG GTTCGCGTCG GGTCCTTGCT GCCCAAGGTC 
GCGGGCGGGA ACGCGATCCA GCCCTATGCC TTCGCCGATG CTGCATGGGT CTGGAACAAC 
GACACCGCGT TCGACGGGCT CGACCCGCAG AAGGTCGTGT CGGTGGGCGG GGGCCTGCGC 
GCCGCGATCC ACGATGCGTT GCGCCTCGAC GCCGGGGTGG CCGTGCCGCT GCACGATCCG 
CTCGGCCTGA ATGTGAAGGG CAAGGCCCGG TTCATGCTCA ACCTTTCGTT CCAGCTCCTG 
CCGTGGAGGC TGTAA

Protein sequence

MSDRLGAQPD FGAVSVVPVR SVGRGAQWLR GRSALLLVAS GVAWSAMASA QTVPPQGVQP 
PTREEIERGV AEGTLKRGGP VSVDTSEVER APCPLAAPDF AGIRLKLHSV TFTGMQEIPG 
FDLSGSYAEF VGTDQPVAVI CEIRDRAATA LRQAGYLAAV QVPPQKIEGG AVRLDVLLAH 
LKRVQIKGDA GASEGILLKY LNKLTRDPVF NTHEAERYLL LAKDVPGLDV RMALRPVEGA 
PGEVIGEVSV RRVPVYAELG LQNYGSRAVG RYSGLARVQI NGLTGLGDAT TASFFATTDL 
EEQKVLQIGH EMRLGGEGFS LRGDFTYGWT NPTVTGAASD FHSRTLSASL EGSYPVVRSQ 
AYNMAVSLGA QIADQDLDFG KIPLNRDRLR VLYARVDTNG VSRKSLTGRD GFTPFEPHWA 
WGLSLEARQG IDVFGATKGC QGALAPTCTG FGKVTPSRIE GTAKGFVLRA AGVLDYRPVR 
GLTLSVQPRA QWSPDKLLSY EEFSGGNYTI GRGYDPGAVI GDSGVGVRGE VRVGSLLPKV 
AGGNAIQPYA FADAAWVWNN DTAFDGLDPQ KVVSVGGGLR AAIHDALRLD AGVAVPLHDP 
LGLNVKGKAR FMLNLSFQLL PWRL