Gene Saro_1036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1036
Symbol
ID	3915818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1074419
End bp	1075405
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	69%
IMG OID	640443770
Product	ABC transporter related
Protein accession	YP_496315
Protein GI	87199058
COG category	[V] Defense mechanisms
COG ID	[COG1131] ABC-type multidrug transport system, ATPase component
TIGRFAM ID	[TIGR01189] heme ABC exporter, ATP-binding protein CcmA

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCAGCG GCGAGGCATC GGCGGTACCT TCCGAAGCGT CGGGCGGTCC CCGACTGCGG 
GCCGAGCCGG ATCTGGTCAT CGATGTGCGC GGGCTGACCA AACGGTTCGG CGGACGGACA 
GTGGTCGACG AGGTGAGCTT GCAGGTGGCG CGCGGGTCGA TCTGCGGGTT CCTCGGGCCG 
AACGGGTCGG GCAAGACGAC GACGCTGCGG ATGATCTGCG GGCTGCTGAT CCCCGATGCG 
GGCGAGGGCG AAGTGCTGGG GCTGGACCTG AGGCGCCAGC GGGGGGCGAT CAAGGGACGG 
GTCGGGTACA TGACCCAGAA GTTCGGGCTG TTTTCCGATC TGACGATTGC CGAGAACCTC 
GAGTTCTTCG CGCGGGTGCA CGGGCTGGAC CGGCGCCGGG AGCGGGTGGC CGAAGCCTTG 
GAAGGGTTGG GTCTCGCCAC ACGTTCGGAT CAGCTGGCAG GCAAGCTTTC GGGCGGGTGG 
AAGCAGCGAC TGGCGCTGGC GGCGGCGGTG CTGCACGAGC CGGAAATCCT GCTGCTCGAC 
GAACCGACGG CGGGCGTCGA CCCGCAGGCG CGACGCGAGT TCTGGGACCA GATCCACGAT 
CTTGCCCAGG GCGGGATGAC GGTGCTGGTG TCGACCCATT ACATGGACGA GGCCGAGCGC 
TGCCACGAGA TTGCCTATAT CGCCTATGGC CGCATGCTGG CGCGCGGGAC GATCGGCGAG 
GTCGTTGCCG GGTCCGGGCT CAAGGCGCTG ATGGGCGAAG GTCCGGGGGC GGACAGGCTT 
GCCTCGCGGA TCGAGGGCCG TCCCGGCGTT GCCATGGCGG CCCCGTTCGG CACCGCGATC 
CACGTCTGCG GGCCCGATAT CGCGGCGCTG CGTGCGGCGG TGGCGGAGTT CGACACGGTG 
GCATGGCATG AGGCCCGGCC GAGCCTGGAG GACGTGTTCA TCCACCTGAT GCGCGGGGCC 
GAGGACAATT CGGTGGTGGC GGCATGA

Protein sequence

MSSGEASAVP SEASGGPRLR AEPDLVIDVR GLTKRFGGRT VVDEVSLQVA RGSICGFLGP 
NGSGKTTTLR MICGLLIPDA GEGEVLGLDL RRQRGAIKGR VGYMTQKFGL FSDLTIAENL 
EFFARVHGLD RRRERVAEAL EGLGLATRSD QLAGKLSGGW KQRLALAAAV LHEPEILLLD 
EPTAGVDPQA RREFWDQIHD LAQGGMTVLV STHYMDEAER CHEIAYIAYG RMLARGTIGE 
VVAGSGLKAL MGEGPGADRL ASRIEGRPGV AMAAPFGTAI HVCGPDIAAL RAAVAEFDTV 
AWHEARPSLE DVFIHLMRGA EDNSVVAA