Gene Saro_0345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0345
Symbol
ID	3918229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	369514
End bp	371550
Gene Length	2037 bp
Protein Length	678 aa
Translation table	11
GC content	59%
IMG OID	640443074
Product	TonB-dependent receptor
Protein accession	YP_495627
Protein GI	87198370
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCAAGA CCATTACTAC CAGCAGCGCC CTTGCGCTGA TCTGTATCGG AAAACCGGCA 
TTTGCCGAAA CCTCTGAAAA GGCATCGCAA ACAAGCGCGG ATGCAGTCGT GGCGGGTAAC 
GACATTGTGG TTTTCGGTCG CGGTGAGGCC ATGATCGGCA CTGCCAAATC AGCGAGCGAA 
GGAAGCGTCG GAGGGGCCGA TCTCCTCGTG CGGCCTCTTC TCCGCGTGGC CGAACTGCTG 
GAAGCGGTGC CCGGGCTGGT TGCAGCCCAG CATTCTGGGA GCGGCAAAGC CAACCAGTAT 
TTCCTGCGCG GTTTCAACCT CGACCATGGG TCTGACTTCA GTACCTATAT CGATGATGTG 
CAGATGAACT TTCGTACCCA CGGACATGGT CATGGCTATC TCGACCTCAA CGGCCTCATT 
CCGGAGATCG TGGGCCGGGA GGATTTTCGT AAAGGGCCCT ACCGCGCCGA TGGCGGTGAT 
TTCGCTCTGG CGGGAGCAGC CTATATGACG ACCATCAAGG GTTATGACCG GCCATGGGCA 
TCGGCCGAGA CTGGTTCATA TGGTTGGCGC CGCGTCGCTG CGGGTGGAAC ATTGCACGAC 
CTGGGCGGCG GAGACCTCAC GCTTGTCGCC CAGGCCAAGG CCTATGACGG ACCGTGGCAG 
GAACCTGAAC GTCTGCGCCA TTACTCGGGG TTCGCGAAAT ATAGCATGCC GACCGGTGCG 
GGCACATTGG AGGCATCTCT CCATGCCTAC CGGGCGACAT GGCACCCAAC CGAGCAAATC 
CCCGAGCGCA TTATCGGCAC GGCGTTGTGT GCGGATGTGT TCTGCTCTCC AGATCCTTCC 
GCGCGGGGTG AGACGACGCG CCTGGTGGCT AACATCGCGG TCAAGCAACC GACATGGCGC 
GCCAATGTCT ATGCCCAGTT TTACGACTGG TCGATGTTCT CGAACCCCAC TTACACCGAT 
CCGGATGGCA CAAGCGCGCA GATCAAGCAG TTCGACCGGC GTTGGGTCCT CGGGCTGTCC 
GCACAAAAAC ATTGGGAAAT CGCTGACAGT CTGGCTGTGA GCCTTGGCAC CGAAAACAGA 
TACGACGCCG TCGGGAATGT TGGTGTCGAT CGAACGGCTG CCCGCGCATT TCTTGAATCT 
CTCGGGCACT TTCGGGTCGG GGAATTGTCT TCCGCGCTCT ACGGCGAAGT CGCTTGGAAA 
CCCTTGGCGG GACTGCGTGT GACAGGTGGT CTTCGCGGGG ACTATTATCA CTATTCCGTG 
CGTGCACGAG ATTCTGTTGC GGCGTCGCTG GGCGAAGGCA GTGGCTCAGC GTCGATTCTC 
TCTCCCAAGG CGTCAATCGC CTATCAGGTT ACGCCGCATC TTGAACTCTA CGCCAACTGG 
GGCCGTGGAT TCCATTCCAA CGATGTTCGG GGTGCGGTCA ACAGGGACAC GCCTGTTCCC 
GTTCTGGTTC GCGGCATCGG CAAGGAACTG GGAGGACGCA TTCAATTCTC CGGGGTCACG 
TTAACCGCGA CTTACTGGTG GCTGCATGTC GGCAGCGAAC TTCGTTTCAT TGGCGATTCC 
AATGCTGTTG AACCGTCGGG TGCCAGTGGG CGTCATGGCT ATGAAATCGT CGCCTTCTGG 
CGGCCGTTCC CTTGGCTTGC GCTTGATGGA AACTATACCG CCAGCCATGC GCGCTTCGAC 
AATGGCGATC ACATCCCCAA TGCATTTGAG AACGCGGCTT CAGCCGGTGC CGCCATCATT 
CTTGATCCCT GGGAAGCCAG CATTCGGGTG CGCCACCTTG GACCTTCTCC GCTTGTCGAG 
GACAACAGTG TCCGGGATCG AGGCAGCACC GTCATGAATG CCCGGGCCGC GTGGAAGGGC 
AAGAAGGTCG AGATATTTGG AGAAGTGCTG AACATCTTCG ACAGCCGGGA CAAGGACATC 
GCCTATTATT ACGAGTCCTA CATCCCCGCC TTCGATGCAG GTGCTCCGGT GGAAGGCCGG 
TTGAGCCGCG TGGTCGAGCC TCGAACTGTG AGGATTGGCG CAAAGGTCAA TTTCTAG

Protein sequence

MIKTITTSSA LALICIGKPA FAETSEKASQ TSADAVVAGN DIVVFGRGEA MIGTAKSASE 
GSVGGADLLV RPLLRVAELL EAVPGLVAAQ HSGSGKANQY FLRGFNLDHG SDFSTYIDDV 
QMNFRTHGHG HGYLDLNGLI PEIVGREDFR KGPYRADGGD FALAGAAYMT TIKGYDRPWA 
SAETGSYGWR RVAAGGTLHD LGGGDLTLVA QAKAYDGPWQ EPERLRHYSG FAKYSMPTGA 
GTLEASLHAY RATWHPTEQI PERIIGTALC ADVFCSPDPS ARGETTRLVA NIAVKQPTWR 
ANVYAQFYDW SMFSNPTYTD PDGTSAQIKQ FDRRWVLGLS AQKHWEIADS LAVSLGTENR 
YDAVGNVGVD RTAARAFLES LGHFRVGELS SALYGEVAWK PLAGLRVTGG LRGDYYHYSV 
RARDSVAASL GEGSGSASIL SPKASIAYQV TPHLELYANW GRGFHSNDVR GAVNRDTPVP 
VLVRGIGKEL GGRIQFSGVT LTATYWWLHV GSELRFIGDS NAVEPSGASG RHGYEIVAFW 
RPFPWLALDG NYTASHARFD NGDHIPNAFE NAASAGAAII LDPWEASIRV RHLGPSPLVE 
DNSVRDRGST VMNARAAWKG KKVEIFGEVL NIFDSRDKDI AYYYESYIPA FDAGAPVEGR 
LSRVVEPRTV RIGAKVNF