Gene Saro_1868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1868
Symbol
ID	3917089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1969087
End bp	1971690
Gene Length	2604 bp
Protein Length	867 aa
Translation table	11
GC content	64%
IMG OID	640444612
Product	TonB-dependent receptor
Protein accession	YP_497142
Protein GI	87199885
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.215038
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGGCG CCAGCAGCAA GAATCAACAG GGAGAGACCA ACATGAGATT TGCATCGATC 
TCCATCGCAG CGCTCGCGAC AGCGATCGCC GCACCTGCCT TTGCGCAGGA CCAGGCCCAG 
GCCGACGACA CCCGCAGCGG TGGCATCGCC GAGATCGTCG TGACCGCGCA GAAGCGCGCG 
GAAAACGTCC AGGACGTGCC GATCGCCATC ACCGCGTTTA CCGCCGGTGC ACTGCAGGAA 
CGCGCCGTGG GCGACGTTTC GGCGCTTTCC GGCATCACCC CCAACGTGAC GCTCGACGCA 
TCGACCCCGT TCTCCGGTTC GAGCGCGGTG CTGGGTGCGA CCATCCGCGG CATCGGTTCG 
TCGGACTTCG CCTTCAACAT CGACCCCGCT GTCGGCGTTT ATCTTGACGG CGTCTACCTT 
GGCCGTTCGA TCGGCGCGAA CCAGGACCTG CTCGACGTCG AGCGCATCGA AGTCCTGAAG 
GGCCCGCAGG GCACGCTGTT CGGCCGCAAC ACCATCGGCG GCGCGATCTC GATCGTGACC 
CACAACCCCG GTGACGAATT CCATGCCAAG GGCGACGTCA CGGTTGGCCG TTTCAACCGC 
ATCCAGGCGC GCGGGCTGGT CGACATTCCG CTGGCTCCGG GCCTCAGCTC GTCGGTTGCC 
TTCGGTCTGC ACAAGCGCGA CGGCTTCCAG AAGCGCGTCG CCTATTCCGA TCCCGGCGCG 
AACGACAGCT TCACACTGTT CCCGGCTTCG GGCTACGAAA CCCGCAGCCG CCAGGGGGGC 
GACAATTCGT GGAACCTGCG CGGCAAGCTG CGCTGGGACG ACGGCGGCAA GTTCCGCGCC 
ACCTTCAGCG CCGACTATAC CAACATCGAC CAGGATTCGA CGGCCAACAC CGTGCTTGCC 
GTCACCCCGA TCCCGGGGCC GTTCGCGGGC GTTGCCGAGA ACAACATTCC GGGCACCGCG 
CTTGACGTCG TCACCGGCAG CTCGGGCTTC CTGTTCGCAG GTCTCTACAA CTTCTGCATT 
GGAGCCACCG CACAGCAGAT CGCCGACCGC AATGCGACCA ACCTGTGCGG CCCGCGTTCG 
AGCGTCAACG GCTACCTGAC CCTGCCGGGT CTCGCCAGCC GCAACGTCGA CGGTGACCCG 
TACAACGACC TGCTGCCTTA CGACGGCCGC TGGGTGAACA CCGACAAGGA CGTCAGCTAC 
GCCAACGGCA ACAACTTCTC GAAGCTGAAG CAGTGGGGCC TTGGTCTCAA CCTCGAGTAC 
GACCTGACTG ACAACATCGC GCTGAAGTCG ATCACGTCGT ATCGCGAAGT GGACTTCAAG 
GCAGGCGTCG ACCTCGACAA CTCGCCGCTG CCGATCCTCC AGACGAGCTT CATCGTCGAC 
CAGTACCAGT TCAGCCAGGA AGTCCAGCTT ACCGGTTCGG CAATGGACGG CGCCCTGAAC 
TTCGTGCTCG GCGGCTATGG CTTCAAGGAA AACGGCGACC TGCGCGACTT CGTGACCTTC 
TCGGCCGGCC TGCTGCAGGT TGACGGTCCG GGCAAGGTCG ACACCGAGGC CTATGCCGGG 
TTCGGTCAGG TCGACTGGCG CGTGAACGAC CTCATCGGTA TCTCGGTGGG CGCGCGCTAC 
ACCAAGGAGA ACAAGCGCTA CGACGGTGCG CAGTCGGACA TCAACGGCTT CAACTACAAG 
CTGTTCAACT GCATGGCGCT GGACCCGGCG ACCGGCAACC CGAGCGCGGA ATGCGCCGCG 
GGCGTCGGCT TCCCGATCCC GTCGGAACCG TTCCGCTACT ATCCAACTTC GCCGAACAAG 
CAGACCTTCG ACGACTTCTC GTACAAGCTG GGCCTCCAGC TTCACCCGAC CGAAGACGTC 
ATGGCCTATG GCTCGTTCTC GCGCGGGTAC AAGACGGGTG GCTGGACGAC GCGCCTGTCC 
AACCCGCTGC CGGTCGCGCC GACCTTCGGC GAGGAAGTTG CCGAGACCTT CGAGGCTGGC 
GTCAAGTCGA CGCTGCTTGA CCGTCGCCTG CAGCTGAATG CAGCGGTGTT CACGACCAAG 
TACAAGGGCA TCCAGCTCAA CTTCCAGCAG GGCGTTTCGC CGACCATCCA GAACGCAGGC 
GACGCGCGGA TCAAGGGCTT CGAGATCGAG GCGGTTGCCG CCCCGGCCGA TGGCTTCACG 
ATCACCGCTT CGGCGGGCTA CCTCGACGCC TACTACACCA ACGTGCTGGC GCCGGCGCAG 
GTTGCGCCCA ACCCGTTCCA GCTCGGCGTG CAGAAGGGGT CGGCCCTGCC CAAGGCTCCG 
GAGTGGAAGT TCAACGTCTC GCCGCGCTAT GAAGTGGCAG TGGGCAACGG CAAGATCGTA 
GCCCTGGCCG ACTGGACCCA CACCACCGGC ATGCGCAACG ATACCGAAGG CACCATCCTG 
CTGCTGCGTC CGACGACCGA CATCGTCAAC GCCAGCCTGC AGTACCAGGC TCCCGACAAC 
CAGTGGAACC TGACGGTCGG CGGGACCAAC ATCACCAACG AACGCTATCT GGTGACCGGT 
CAGGCCCAGA TCGCGGGCGG CCAGATCTAC GGCACCTACA GCCGTCCGGC CGAATGGTAC 
GTCAGGCTCG GTTTCGAGTT CTGA

Protein sequence

MPGASSKNQQ GETNMRFASI SIAALATAIA APAFAQDQAQ ADDTRSGGIA EIVVTAQKRA 
ENVQDVPIAI TAFTAGALQE RAVGDVSALS GITPNVTLDA STPFSGSSAV LGATIRGIGS 
SDFAFNIDPA VGVYLDGVYL GRSIGANQDL LDVERIEVLK GPQGTLFGRN TIGGAISIVT 
HNPGDEFHAK GDVTVGRFNR IQARGLVDIP LAPGLSSSVA FGLHKRDGFQ KRVAYSDPGA 
NDSFTLFPAS GYETRSRQGG DNSWNLRGKL RWDDGGKFRA TFSADYTNID QDSTANTVLA 
VTPIPGPFAG VAENNIPGTA LDVVTGSSGF LFAGLYNFCI GATAQQIADR NATNLCGPRS 
SVNGYLTLPG LASRNVDGDP YNDLLPYDGR WVNTDKDVSY ANGNNFSKLK QWGLGLNLEY 
DLTDNIALKS ITSYREVDFK AGVDLDNSPL PILQTSFIVD QYQFSQEVQL TGSAMDGALN 
FVLGGYGFKE NGDLRDFVTF SAGLLQVDGP GKVDTEAYAG FGQVDWRVND LIGISVGARY 
TKENKRYDGA QSDINGFNYK LFNCMALDPA TGNPSAECAA GVGFPIPSEP FRYYPTSPNK 
QTFDDFSYKL GLQLHPTEDV MAYGSFSRGY KTGGWTTRLS NPLPVAPTFG EEVAETFEAG 
VKSTLLDRRL QLNAAVFTTK YKGIQLNFQQ GVSPTIQNAG DARIKGFEIE AVAAPADGFT 
ITASAGYLDA YYTNVLAPAQ VAPNPFQLGV QKGSALPKAP EWKFNVSPRY EVAVGNGKIV 
ALADWTHTTG MRNDTEGTIL LLRPTTDIVN ASLQYQAPDN QWNLTVGGTN ITNERYLVTG 
QAQIAGGQIY GTYSRPAEWY VRLGFEF