Gene Saro_3084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3084
Symbol
ID	3916699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3302873
End bp	3305065
Gene Length	2193 bp
Protein Length	730 aa
Translation table	11
GC content	65%
IMG OID	640445867
Product	TonB-dependent receptor
Protein accession	YP_498353
Protein GI	87201096
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGGTC ACGTTTTCCT CAAGACTGCG AGCCTTTTCG CGCTGATGCT GTCGGCCGCG 
CCCGCCCTTG CCGCGCCCGC CCTTGCCGCG CCCGCCCTTG CCGCGGACGA ACAGGACCAG 
CCCTCCGACG GCGGTCTTGG CGAAATCGTC GTGACCGCGC AGAAGCGTGC CGAACCGTTG 
CAGAAGACGC CGATCTCGAT CGTGGCGCTG ACGGCGGACG ACATCGCGAA GAAGGGCATT 
GCCGACCTTA CCGACCTGCG CTCGCAGGTG CCCGCGCTGC AGGTAACGCC GCATCCGAAC 
AGCGCGACGA CAGCGCGTGT CTTCCTGCGC GGCGTCGGCA ACAACGACGA CCAGATCACC 
GTCGATCCCA GCGTCGCGAT CTATCTCGAT GGCATCTACG TGGCGCGCGG GCAGGGGCTT 
GCGGCCGAGA TCGCGGAGAT CGAGCGCATC GAGGTGCTGC GCGGCCCGCA GGGGTCGCTC 
TACGGTCGCA ACGCCACGGG CGGTGCGATC AACTACATCG CACGGCAGCC CCGGCTTGGC 
GAGTTCCACG CGCGCCAGTC GCTGGCCTAC GGCAACTACG ACCAGTTCCG TTCGCGCACG 
AGCGTCAACG TTCCGGTCGG CGAAACCCTT GCCGTGGAAC TGGCCTATCT GCACAGCAGC 
AAGGACGGCT TCGTCCGCAA CCTTGGTACC GGTGTGGAGC GTTTCGGGGA TCAGCGCCGC 
GATGCCTATC GCGCGGCCGT GCTGTGGCAG CCGGCGCCGT CCTTCGAGCT GCGCTATGCC 
TATGACCGGT CGGACATTGC CGATACCCCC GCGTTCATGG TCTCGGCGCC GTACTACCCG 
CGCATGGCGG TTCGACCGAC CGCAGGCTCT CCCGCCGTCC GCGACCTTGC GGCGAATGAC 
GTGACCGCGC AGGGCCATAG CCTCGTCGCG AGCTGGAACG CATCGGACGA GGTCACCATC 
CGCTCGCTGA CGGGCTATCG CAAGCTCGCC AACTTCACCA ACCAGAACTA CCTGACCGGC 
GTTGCCGGGC CATTCCCTGT CTTCGTCACC ACTTTCGACC AGAACCAGCG TCAGTGGAGC 
GAGGAACTTC AGGTCGTCGG CTCTGCGCTC GACCGCCAGC TGGAATACAC GTTGGGCGCC 
TATTTCTTCG ACGAGAAGGC CTTCAGCTAT GACACCACCG TGCCGACGGG GCGGGCGACG 
ACACTGCGCA CGGCAACCGT GCGCAACCGT GCCTGGGCAC TCTATGGGCA GATGACCTGG 
CGGCCCGAAG CGCTTGCAGG GGTCTATCTG ACCGGCGGGC TGCGCTGGTC GCGCGACAGC 
CGCAAGGCAA CGCTGGACCA GACGTCGGTC GCACTGAACG GCACCAGGAC GGTCCGCCCC 
CAGGGGCGCG GCGACAACAG CTTCACCGAC GTAAGCCCCA GCGTGATCCT GGGATACGAC 
GTCAACCGCG ACGTCAACGT TTATGCAAAA TGGTCGCGCG GCTACAAGAC CGGCGGCTAC 
AACCTGCGGG CCAGCACGAT AGAGCGTTTT GCCGAAGGCT ATGGCCCGGA GCGGCTCGAT 
TCATTCGAAT TCGGCCTCAA GTCCAGCTGG CTCGATAATC GTCTTCGCGC CAACGTCGCG 
GTGTTCCGGG CGAACTACCG GGATATCCAG GTCAACATCC AGTCCGATCC GGAGAACCCC 
GCCGTCACCG ACATCTTCAA CGCAGGCGAG GCGCGCATCC AGGGTATCGA ACTGGACCTC 
ACGGCCAAGC CATCGCGGGC GCTTACGGTC AATGCCAACT ACGCCTTCCT CGATGCCGGC 
TACCGCCGGA TCACCGATCA GATCACCGGC GCGAACATCG CCTCGCGCTT CAACTTCGTC 
GAGGCGCCGC GTCACACCCT GACCGTAGGC GCGGAATGGA CCCTGCCGGA AACGCCGCTG 
GGCGTCCCAT CGGCAAGCGT CGACTACTAC ATGCAGAGCC GCAAATTCTC CTCGACCACC 
GATGCGCGCT ACATCGTTGG CGACTACGGC CTGCTCAATG CGCGGCTCAG CCTTTCGGAG 
ATCCCGGTGG GCTTCGGCAA GTGGCGGCTT TCCGCCTATG CCCGCAACCT GACGGATACA 
AAGTACTACA TCGCCAACTT TTCTGCCGGG CTGCCCGCCG CCTTCTTTGG TGAACCGCGC 
ACGTATGGCA TCGAATTGAA CTTCGAATAT TGA

Protein sequence

MSGHVFLKTA SLFALMLSAA PALAAPALAA PALAADEQDQ PSDGGLGEIV VTAQKRAEPL 
QKTPISIVAL TADDIAKKGI ADLTDLRSQV PALQVTPHPN SATTARVFLR GVGNNDDQIT 
VDPSVAIYLD GIYVARGQGL AAEIAEIERI EVLRGPQGSL YGRNATGGAI NYIARQPRLG 
EFHARQSLAY GNYDQFRSRT SVNVPVGETL AVELAYLHSS KDGFVRNLGT GVERFGDQRR 
DAYRAAVLWQ PAPSFELRYA YDRSDIADTP AFMVSAPYYP RMAVRPTAGS PAVRDLAAND 
VTAQGHSLVA SWNASDEVTI RSLTGYRKLA NFTNQNYLTG VAGPFPVFVT TFDQNQRQWS 
EELQVVGSAL DRQLEYTLGA YFFDEKAFSY DTTVPTGRAT TLRTATVRNR AWALYGQMTW 
RPEALAGVYL TGGLRWSRDS RKATLDQTSV ALNGTRTVRP QGRGDNSFTD VSPSVILGYD 
VNRDVNVYAK WSRGYKTGGY NLRASTIERF AEGYGPERLD SFEFGLKSSW LDNRLRANVA 
VFRANYRDIQ VNIQSDPENP AVTDIFNAGE ARIQGIELDL TAKPSRALTV NANYAFLDAG 
YRRITDQITG ANIASRFNFV EAPRHTLTVG AEWTLPETPL GVPSASVDYY MQSRKFSSTT 
DARYIVGDYG LLNARLSLSE IPVGFGKWRL SAYARNLTDT KYYIANFSAG LPAAFFGEPR 
TYGIELNFEY