Gene Saro_3033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3033
Symbol
ID	3916645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3244497
End bp	3246293
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	69%
IMG OID	640445813
Product	ABC transporter related
Protein accession	YP_498302
Protein GI	87201045
COG category	[V] Defense mechanisms
COG ID	[COG2274] ABC-type bacteriocin/lantibiotic exporters, contain an N-terminal double-glycine peptidase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.275745
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCACCGCC CAACTCGGCC AGCTCCCCGA ACCACGCTTC GCCATCCACG GCTTCGACCT 
CGTGCGCAGG GAACTGGCCG CCTGATCCCG CCCGCCACCC CAACTCCGGC GCCGACGGTC 
GCGCCGTGGA GCACCTACCG CAGGCTCTGG CCGTGGCTGC GCCCTCACGC CCCGCGCCTT 
GCGCTGGTCC TGCTCGCCAG CCTTCTCGCG ACAGGCCTCA ACCTCGCGCA GCCGTGGATC 
TCCAAGCTGA TGATCGACGA GGCCCTGCTC AAGCGCGACT GGGACGCGCT ACTACGGATC 
GCCGGCCTCA TGGTGGCGGC CACCGTCGGC GGCTTCGCAG TCAATGCGCT CGTCTCCTAC 
CGCTACGTCG CGATTTCCGC GCAGATGCTG TTCGACATGC GCGTCGCGCT GCTACGTCAC 
CTCCAGACGC TCAGCCCCCG CTTCTACGGC AGTTTCCGCC TCGGCGATCT CATGTCGCGC 
CTCAACAGCG ACGTTTCCGA TGTCCAGCGC GCAGCCGGGG ACACGCTCCT CTCGGTCCTC 
AGCAATGTCC TGTTCTTCGC CGGCAGCGTC GGCATGATGC TGTGGCTCGA CTGGAAGCTG 
TTCCTTGTCG GCACGCTGCT GGTGCCGCTG GCCGTCGCCA GCTTCCTCCA CTTCCAGCGC 
CGCATGACCG ACCTTACCCG CCAGATGCGC GAGCGCGGGG CCGATATCGG CAGCCTGCTG 
GTCGACACGA TCATGGGCAT GCGCACGGTC AATGCGCTCG GCGCCGAAGC ACACGAGGCC 
GACCGTTTCC GCGCCGCCAA CGCTGGCTTT ATCCACGCGA TGTTGCGGAT GCAGACCGTC 
TCGTTCCTCA CCGGCGCCTT GCCCGGCACC ATCGTCACCG CCTCGACTGC GGCCGTGATC 
GTCTTTGGCG GCAAGCAGAT CATCGACGGC ACCATGACCA TCGGCGCTCT GGTCGCGTTC 
CTCACCTATC ACGGCAGGCT GCTCGCGCCG GTCCAGGCGC TGATGGGCCT GACCGCCACC 
CTCGCCTCCG CCCGCGTCGC ACTGGCGCGC ATCTTCGAGC TTTTCGACAC ATCGGCGGAA 
GTCGCGGACG CCCCCGCGCC GCGCCCGCTT CCGCCGGTGA CCAGGGCGAT CCGCCTCGAC 
GGCGTGACCA TGCACCACGG GCGCGAACCG GTCCTGCGCG ATGTCAGCCT GACCATCCCC 
GCTGGCAGCC TGACCGCCAT CCTGGGCGCT TCGGGCGCGG GCAAATCGAC CCTGGCCGAC 
CTCCTGGTGC GCTTCCTCGA CCCTGTCGCC GGGCGCATCA CCATCGACGG TATCGACCTC 
CGCGACCTCG CTCTTGCCGA CCTGCGCCGC CGCGCGCTGC TGGTCGACCA GTCGCCCTTC 
CTGTTCAACG CCACGATAGC CGAAAACATC GCGTTCGCCC GCACAGGTGC GCTCCCGGCA 
GAGGTCGCCG CCGCAGCCGG CGCCGCCGGT CTGGACCCGC TGATCGCCCG CCTGCCGGAA 
GGCCTCGCCA CCCGCACCGG CGAACGCGGC CTTGCTCTCT CTGCCGGAGA ACGCCACCGC 
ATCGCGCTCG CCCGCGCGCT TCTGCGCAAG CCCGACGTGC TGATCCTCGA CGAGCCCACT 
GCCGCGCTCG ACGAGGCGAC CGAGCGGCTC GTCGCGTCAG GCCTGCGCCG CGCGCTGCCC 
GATGCAACGC TCGTCGTCAT CACCCACAAG CCGGCGCTCG CCGATCTGGC CGACCATGTC 
GTGCGGCTCG AACAGGGCAA TGCCACGATC CAGCCCCAGG TGCCTGCCCA TGTATAA

Protein sequence

MHRPTRPAPR TTLRHPRLRP RAQGTGRLIP PATPTPAPTV APWSTYRRLW PWLRPHAPRL 
ALVLLASLLA TGLNLAQPWI SKLMIDEALL KRDWDALLRI AGLMVAATVG GFAVNALVSY 
RYVAISAQML FDMRVALLRH LQTLSPRFYG SFRLGDLMSR LNSDVSDVQR AAGDTLLSVL 
SNVLFFAGSV GMMLWLDWKL FLVGTLLVPL AVASFLHFQR RMTDLTRQMR ERGADIGSLL 
VDTIMGMRTV NALGAEAHEA DRFRAANAGF IHAMLRMQTV SFLTGALPGT IVTASTAAVI 
VFGGKQIIDG TMTIGALVAF LTYHGRLLAP VQALMGLTAT LASARVALAR IFELFDTSAE 
VADAPAPRPL PPVTRAIRLD GVTMHHGREP VLRDVSLTIP AGSLTAILGA SGAGKSTLAD 
LLVRFLDPVA GRITIDGIDL RDLALADLRR RALLVDQSPF LFNATIAENI AFARTGALPA 
EVAAAAGAAG LDPLIARLPE GLATRTGERG LALSAGERHR IALARALLRK PDVLILDEPT 
AALDEATERL VASGLRRALP DATLVVITHK PALADLADHV VRLEQGNATI QPQVPAHV