Gene Saro_3147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3147
Symbol
ID	3918189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3356399
End bp	3358726
Gene Length	2328 bp
Protein Length	775 aa
Translation table	11
GC content	66%
IMG OID	640445931
Product	TonB-dependent receptor
Protein accession	YP_498416
Protein GI	87201159
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID	[TIGR01783] TonB-dependent siderophore receptor [TIGR03304] outer membrane insertion C-terminal signal

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.774521
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCGTA TGTCCACGCG CGCCGTTCTG GCCGCATCTG CCGCGCTGTT CGCGCTGCCT 
GCCGTCCCCG CCATTGCGCA GGAAGCACCG GCTGACGAAA CCACCGCCTC GAACGAGATC 
ACCGTCATCG CCCGCCGCCG CGAGGAGCGC CTGCTCGACG TGCCGATCGC GATCTCCGCG 
CTCAGCACCG AAGCGCTCGA CAAGGCCGGC GCCAAGGATC TCTCCGGCGT CCAGGGCGCG 
ATCCCCAACG TCAACATCGT GCAGGGCCGC GGCTCGGCCA GCAGCGCCAA CTTCTACATC 
CGCGGCATCG GCCAGCCGGA CGCGCTGCAG ACCTTCGACC CGGCTGTCGG CGTCTATGTC 
GACGGCGTTT ACCTCAGCCG CATCCAGGGT GCGCTGCTCA ACCTGTTTGA CGTCCAGCGC 
GTCGAAGTCC TGCGCGGGCC GCAGGGCACG CTCTATGGCA AGAACACCAT CGGCGGCGCG 
GTCAACGTCG TCTCGAAGAA GCCCGACCTC AACGACTTGC GCGGCGAAGC GTCGATCACC 
TACGGCCGCT TCGACGAAGT GACCGCCAAG GGCTACGTCT CGGCCCCGCT TGTCGCGGAC 
AAGCTCGCCC TCTCGGTCGC GGGGGTCTAC GACGACCGCG ACGGCATCGT CACCGATCCC 
GCCACCGGCC GGAAGTACAA CGACCGCAAC AACCTCTCGG GCCGCGCAAT CCTTCGCGCC 
CAGCCGACCG ACACCGTCGA GGTCCTGATC TCGGGCGATT ACACCCGCCA GCGCAACTCG 
CTGACCATGG GCCAGGCGAC CGCCCCGCTG ATCGGGTTCG ACTACAACGC CGACTTCAGC 
GCCGTCACGC CCTTCGTGAT CGCGCCCGCC GCCACCGGCG AATGGGACTA CAAGGCCTCC 
AGCAGCTTTG CCGGCGACAA GGGCCAGAAG CTCGACCACT GGGGCGTTTC GGGCACGATC 
AACGTCGACC TGTCCGATAC CCTGCAACTC GTCTCGATCA GCGCCTACCG CAAGCTCAAG 
ACCGACTTCT TCGTCGACAT CGACGCAACC ACCGCCGAAG TGGGCGACGT CTTCGTCGGC 
ACCCGCCAGC ACCAGTTCAG CCAGGAACTC CAGCTCAAGC TCGATGCCGA CAAGCTCAAG 
GGCGTGCTCG GAGTCTACTA CCTGAACGAG CACGTGACCT CGCACCAGGA AGCCTATGCC 
GACAGCTACC TGCGCTATGT CGGCACGCCG CTCAACTTCC TGCGCACCAT CGATGACGAG 
CAGGACACCA AGTCCTACGC CGCCTTCGGC CAGCTTACCT ACGACTTCAC CGATGCGGTC 
TCGCTGACCG GCGGCCTGCG CTACACGCGC GAGACGAAGG AATACTTCCG CACCACCACG 
GCCACCACGT CGAGCCCGAT CTTCCCGGCC CTGGTCATCA AGGGCACCTT CACCTTCCCG 
ACCAACCTGC CCGCCCCCTA CAACACGCTC GACAGCGTGA CCTACGAGGC GTGGACCCCC 
TCGGCGACGC TCAGCTACAA GCCCTCGCGC AACACGATGC TCTACGGCTC GGTCAGCCGC 
GGCTTCAAGT CGGGCGGCTT CAACGGGCGC GTCAACGGGC TCGGCGACGT CACCCAGGTG 
GTCGACGGCA CGACCGTCGT CGTACCGACC TTCAAGCCTG AAACCGTGTG GACCTACGAA 
GTCGGCGCCA AGGGCTCGTT CCTCGACGGG CGCGTGAACA TCTCGGGCGC GGCGTTCTAT 
TCCGACTACG CGAACTTCCA GGCGCGCGTC GGCGGCGGCA ACACCGGCAT CAACGGCGGC 
AGCTTCCCCG TGCTCAACGC CGGCAAGCTG CGCATCCAGG GCTTCGAGTT CGACGTCAAC 
GTGCGGCCCG CCGATCCGGT CACGCTGTTC GCCTCGGTCG GCTATCTCGA TGCCGACTAC 
AAGGAGTTCA ACGACGGCCG CCGGGCGCCC GCGTTCTCGT GCAACCCGAC TGGCGCGAAG 
GTGACCTGCA AGCCCGCCTT CGCCCCGCCG CTTACCCTTC GCGCGGGCGG CGAATACCGC 
GTGCCGCTGG GCGATGCGAC GCTGAGCCTG GGCGGCGACG TCCGCTTCGT CGACAAGCAT 
TACCTGTCGG TCGACAACCG CCCCGGCCTC ACCGAAGACG GCTACCTGAT CGGCAACCTC 
TATGCCCAGG TGGACTTCGA CAAGTTCTAC CTGCGCGGCG CGGTCCGGAA CGTAGGCAAC 
ACGCTCTACA AGACCGACGG GCAGGAATTC AGCTCGGTCG GCAACATCCA GACCGTCTAC 
TATGGCGACC CGCGCACGTG GAACGTCACG CTCGGCGTCC GCTTCTGA

Protein sequence

MTRMSTRAVL AASAALFALP AVPAIAQEAP ADETTASNEI TVIARRREER LLDVPIAISA 
LSTEALDKAG AKDLSGVQGA IPNVNIVQGR GSASSANFYI RGIGQPDALQ TFDPAVGVYV 
DGVYLSRIQG ALLNLFDVQR VEVLRGPQGT LYGKNTIGGA VNVVSKKPDL NDLRGEASIT 
YGRFDEVTAK GYVSAPLVAD KLALSVAGVY DDRDGIVTDP ATGRKYNDRN NLSGRAILRA 
QPTDTVEVLI SGDYTRQRNS LTMGQATAPL IGFDYNADFS AVTPFVIAPA ATGEWDYKAS 
SSFAGDKGQK LDHWGVSGTI NVDLSDTLQL VSISAYRKLK TDFFVDIDAT TAEVGDVFVG 
TRQHQFSQEL QLKLDADKLK GVLGVYYLNE HVTSHQEAYA DSYLRYVGTP LNFLRTIDDE 
QDTKSYAAFG QLTYDFTDAV SLTGGLRYTR ETKEYFRTTT ATTSSPIFPA LVIKGTFTFP 
TNLPAPYNTL DSVTYEAWTP SATLSYKPSR NTMLYGSVSR GFKSGGFNGR VNGLGDVTQV 
VDGTTVVVPT FKPETVWTYE VGAKGSFLDG RVNISGAAFY SDYANFQARV GGGNTGINGG 
SFPVLNAGKL RIQGFEFDVN VRPADPVTLF ASVGYLDADY KEFNDGRRAP AFSCNPTGAK 
VTCKPAFAPP LTLRAGGEYR VPLGDATLSL GGDVRFVDKH YLSVDNRPGL TEDGYLIGNL 
YAQVDFDKFY LRGAVRNVGN TLYKTDGQEF SSVGNIQTVY YGDPRTWNVT LGVRF