Gene Saro_2147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2147
Symbol
ID	3918812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2289255
End bp	2290436
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	67%
IMG OID	640444902
Product	secretion protein HlyD
Protein accession	YP_497420
Protein GI	87200163
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACTTGG AAACTGGAAC GGATCCCAAA CGTCTCCTGA TCGGAGCGGC AGTGGCAACC 
CTTATCGTCG GCACTGCGGG TATCATGCTC GGCCGCACCG TGCTTGCCCC CTCTCCAGCC 
TCGACAGAGG CGGGGCCATC GGGCGAGGCG GAAGAAGAAG GCCACGTCGA AGGCCTGGTC 
GAGATGGACG CCAAGCGTGC TGCATCGGCA GGCATTGTTA CCGAGACCGC GCAGGCTGGT 
TCCCTCGGTG CCGAAATCCT CGCACAGGGC GTCGTCGCCC CGACGCCGGA TGGCGAAGCA 
ATTCTCACTG CCCGCGCCGA TGGCGCGGTC GTGCGGATCG CCAAGGGTCT CGGCGACGCG 
GTAGCTGCTG GCGAAACCAT TGCCTGGCTG GAGAGCCGGG ACGCAGCGGC GATTGCCGCT 
GAGCGGAGTT CCGCCGCAGC GCGTGTTGCG CTCGCCCGAT CGACCTTCGA GCGCGAACGG 
CGACTCTATG AGGCTAAGGT TACCGCGCGG CAAGATTTCG AAGCCGCCCG CGCCGCGCTG 
GCTGAGGCGG AAGCCGAGAT GCGACGCAGC CAGTCGGCGG CGAGCGCGTC GAAAGTGTCC 
GGCGATGGCC GGACCCTTGC CGTCACCAGT CTGATTGCGG GGCGGATCAC CAAGTCGGAT 
GCGCGGCTCG GCGCCTACGT TTCCGCCGGC ACGGAGCTTT TCCGAGTCGC CGATCCTCGC 
CGAATCCAGA TCAACGCCTC GGTGCTACCC GCCGATGCCC GCCGCGTCTC GCCTGGCGAC 
CGCGCAGTCG TCGAGCTAGT CGGCGGGGAA ACCGTCGGTG CCACAGTTCG CTCGGCAACG 
CCCAGCCTCG ATCCGGAAAG CAAGGTCGCG ACCCTCGTCC TCGTGCCGGA CAGCGGCGCT 
CAACTCACTC CGGGCCAGGG GCTGCGTGTG CGGATCACCC CGCGTAATGC TGTTGCCACT 
TCAAGCATCG GCCTGCCGGA CGAAGCGGTT CAGTCGGTCG AAGGGCGCGA TGTCGTCTTT 
GTGAAGACCG CCAAGGGCTT CCAGGCCACG AACGTGACCG TGGGACAACG CAGCGCGGGC 
CGTGTCGAGA TCGTTGCCGG TCTGAAGCCG GGCAGCGTGG TCGCGACGCG CGGCGCATTT 
CTTCTGAAGG CCGAACTCGG CAAGGGCGAG GCGGAGCATT GA

Protein sequence

MDLETGTDPK RLLIGAAVAT LIVGTAGIML GRTVLAPSPA STEAGPSGEA EEEGHVEGLV 
EMDAKRAASA GIVTETAQAG SLGAEILAQG VVAPTPDGEA ILTARADGAV VRIAKGLGDA 
VAAGETIAWL ESRDAAAIAA ERSSAAARVA LARSTFERER RLYEAKVTAR QDFEAARAAL 
AEAEAEMRRS QSAASASKVS GDGRTLAVTS LIAGRITKSD ARLGAYVSAG TELFRVADPR 
RIQINASVLP ADARRVSPGD RAVVELVGGE TVGATVRSAT PSLDPESKVA TLVLVPDSGA 
QLTPGQGLRV RITPRNAVAT SSIGLPDEAV QSVEGRDVVF VKTAKGFQAT NVTVGQRSAG 
RVEIVAGLKP GSVVATRGAF LLKAELGKGE AEH