Gene Saro_3530 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3530
Symbol
ID	5077679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	145800
End bp	148157
Gene Length	2358 bp
Protein Length	785 aa
Translation table	11
GC content	64%
IMG OID	640481254
Product	TonB-dependent receptor
Protein accession	YP_001165916
Protein GI	146275756
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTGT CACGTGCAAT CCAGTTGATG AGCGGTCTTT CCGCCATCGC GCTCGCGGCT 
GTTCCCGCCG GGGCAATGGC GCAGGCCGCG CCCGATCAGG CCCAGGCCGC TGATGCGCCC 
ACCGGCGGCA TCGGCGAAAT CATCGTCACC GCGCAGAAGA AGGCGGAAAG CATCCAGACC 
GTGCCGATCT CGATCGCGGC GGTCGGCGGC GAACAGCTTT CGGCAATGAA CGTCACCACG 
CTCCAGGCAC TTCAGGGCTC GGTCCCGAAC GTCCAGATCG ACAACTTCGC CAATACGCCC 
AACAACGCGG TCTTCACCAT TCGCGGCATC GGCGTGATCG AACCCGATCC CTATGCCGGC 
AACACCGTGT CGATCGTGGT CGATGGCGTG CCGCAGTTCT TCTCGATGGG CGCGCTGCTC 
GACACCTACG ACACCAACCG GGTCGAGATC CTGCGCGGTC CCCAGGGCAC CCTGTTCGGC 
GCAAACACCA CCGGCGGCGT CGTCAACGTC GTGACCAACC AGCCGGACGG CAAGTTCGAC 
GGCTACGTCA AGGGCACCTA CGGCAACTGG AACCGCTTCG ACATCAGCGC CGCCGTGGAA 
GCGCCGCTGG TCGAGGACAC CCTCAGCCTC AAGGTCTCGG GCATCCACAC CCAGCGCGAT 
GGCTGGACGA CCAACGTGTG GAACGGCGAA GACATGGGCC GCAAGAACGT CGATGCGGTG 
CGCGGCCAGC TCTACATCAC GCCCAACGCC GATCTCAGGA TCACGCTCCA GGGTGAATAC 
GTCGCCGCGC GCAACGGCGC GCCCATCGTC GTCAACGGCG GCCTGCCCGG CGAAGGCAAC 
TACGTTCCCG AAGGCACGTT CTGGAACGGC GCCAAGCTGC CGATGTACCA GAGCCCCTGC 
TCGGTCGAGG GCCAGCCCTG CAAGGCGCCC GACAAGTACT ACTCCGGCAA CAACGAAGTG 
CCCGACCAGT CGGACATGAC GACGAAGTTC TTCGTCGGCA CGATCCAGTA CGACAACACC 
CCGCTGGGCG ACATCACCGC GATCACCGGC TACAAGCGCT TCACGCTGTT CGAATACACC 
GACCAGGACG GCACCGCGAA GACCAACAAC GCAACGCGCC GCCGCACCCG CGGCTGGCAG 
TTCAGCCAGG AACTGCGCAG CGCCTTCGAG GCGGGAGACA ATTTCAACGC CGTCGCGGGC 
CTGTTCTACC TGAAGACGCA CTACAACCAC TACCAGATGT ACCACCTGGA CTTCGCCCTT 
CCCGGCCTCG TCCAGTACAA CGAACAGGAC CAGGGCACGG AATCGTTCTC GGCCTTCCTG 
CAGACCTACA CCCAGCTTAC CGACCAGCTG AAGCTGTCGG CCGGCGTGCG CTACACGCAT 
GACAGCGTGA ACGCCCGCTC CACGCTCGAC TACGGCGTCG GCGCGCCCGC GCTCACCGAT 
CCGAACTGGG CCATCATCCC GACCATCGTC GTCGATGGCG AGACTCTCCA GGTCGGCCGC 
GACCTTCGCA CCGGCCCGCA CGACATCGAC GTCGGCGGCA AGAAGAGCTG GGACAACGTC 
GGCTGGAAGC TCGGCCTCGA TTACGAGATC GGCCAGAACC AGATGGTCTA TGCAAGCTGG 
GCGCGCGGCT TCAAGTCGGG CGGCTTCACC GGCCGCATCG GCACCGCGTC GGACGGCGAC 
ACGCCCTACG GCCCGGAAAA GGTCGATACC TTCGAGGTGG GCCTCAAGGC CGACTTCCTC 
GACCGCCACG TGCGCACCAA CCTCGCGGTG TTCTACACCA ATTACCGCGA CATGCAGGTC 
GCCCAGATCT ATTTCGATCC CGATACCAAC ACTCAGGGCA ACCGCATCCT CAACGCCGCC 
AAGTCCGAGA TCAAGGGCTT CGAACTTGAA GTCCAGGCGA TCCCGTTCGA AGGCCTCACC 
CTGCGCGGCT CGCTCGCCTA CCTCGACACG AAGTACAAGA GCTTCCTCTA CTTCGATCCG 
GTCGCGGAAG AGTACCTCAA CCTCAAGGGC TACGCGCTCC AGAACGCGCC GAAGTGGGCT 
TCGACGCTTG GCCTCAACTA CACCAAGACG ATGGACAACG GGAACTCGAT CGTTGCCGAT 
GTAAGCTGGA TGTACACCGG GCAGAAGTTC TACACTGCCG TGGTCAACAC CCCGCGCTCG 
TCGATCCAGC CGACCTACTA CGTCGACGGC ATGCTGACCT GGTACGGCCC GGACAAGCGC 
TACTCGATCG GCCTGTGGGG CAAGAACCTG TTCGACAAGC GCTATATCTC CACCGTCTAC 
GACAGCCCCG GCTACATGGG CCTCGTCGGC TACGCACCGC CGCGCCAGTT CGGCGTTTCG 
GTCGGCTACA ACTTCTGA

Protein sequence

MKVSRAIQLM SGLSAIALAA VPAGAMAQAA PDQAQAADAP TGGIGEIIVT AQKKAESIQT 
VPISIAAVGG EQLSAMNVTT LQALQGSVPN VQIDNFANTP NNAVFTIRGI GVIEPDPYAG 
NTVSIVVDGV PQFFSMGALL DTYDTNRVEI LRGPQGTLFG ANTTGGVVNV VTNQPDGKFD 
GYVKGTYGNW NRFDISAAVE APLVEDTLSL KVSGIHTQRD GWTTNVWNGE DMGRKNVDAV 
RGQLYITPNA DLRITLQGEY VAARNGAPIV VNGGLPGEGN YVPEGTFWNG AKLPMYQSPC 
SVEGQPCKAP DKYYSGNNEV PDQSDMTTKF FVGTIQYDNT PLGDITAITG YKRFTLFEYT 
DQDGTAKTNN ATRRRTRGWQ FSQELRSAFE AGDNFNAVAG LFYLKTHYNH YQMYHLDFAL 
PGLVQYNEQD QGTESFSAFL QTYTQLTDQL KLSAGVRYTH DSVNARSTLD YGVGAPALTD 
PNWAIIPTIV VDGETLQVGR DLRTGPHDID VGGKKSWDNV GWKLGLDYEI GQNQMVYASW 
ARGFKSGGFT GRIGTASDGD TPYGPEKVDT FEVGLKADFL DRHVRTNLAV FYTNYRDMQV 
AQIYFDPDTN TQGNRILNAA KSEIKGFELE VQAIPFEGLT LRGSLAYLDT KYKSFLYFDP 
VAEEYLNLKG YALQNAPKWA STLGLNYTKT MDNGNSIVAD VSWMYTGQKF YTAVVNTPRS 
SIQPTYYVDG MLTWYGPDKR YSIGLWGKNL FDKRYISTVY DSPGYMGLVG YAPPRQFGVS 
VGYNF