Gene Saro_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2046
Symbol
ID	3917693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2184172
End bp	2185611
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	68%
IMG OID	640444798
Product	TPR repeat-containing protein
Protein accession	YP_497319
Protein GI	87200062
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCGCTGC GCCAGGCGCT GCGACAGGGT GTCCCGCTGA CCGAGGTGCG CGCCGAGCTT 
GGCGATGCGC TTCTTCTGCA GGGCAACCGC CAGGAAGCGC GCAAGGTGCT TTACGGAGGC 
GCCTTTCCAT CTGGCACCGA AGCGCGCGGA TGGCGCCTGA AAGGGCGTCT GGAGCTTGTC 
GAGGGCAATC TCGGCGCTGC CGGATACGCC TTCGACCAGG CATTGCGATT GGCGCCTGAC 
GAGTCGTCGT TGTGGATAGA CATTGCCCGT TTGCGCTTCA TGGGCGGCGA GGAGGCGCAA 
GCGATCGAAG CCGCCGATCG CGCGGTGCGA CTGGCGCCGC GCGATCCCCG CAGCCTCGAA 
TTGCGCGGGT TGCTGGTGCG CGAACAGTTT GGCCTGCGTG CAGCGCTGCC ATGGTTCGAG 
GCGGGGCTGG CGGCGGCCCC TGACGACACC GGCCTGCTGG GCGAATATGC CGCCACGCTT 
GGCGACCTTG GCCAGTATCG CGCGATGCTG GTCGTGTGCC GCAAGCTGGC AAAGGTAGAT 
CCGGGCAACC TGCGCGCGCT CTACCTTCAG GCCGTACTGG CAGCGCGGGC AGGGCGCATC 
GATCTTGCCC GCAAGATCAT GCAGCAGACC GGCACGGCGT TTCGCGATGT CCCGGCTGCG 
ATGCTGCTCA ACGGATTGCT CGAGTATCAG GCCGGGAACG CCAATCTCGC GGTCGGGTAC 
TTCGACCGCC TGGTGCGGGC GCAGCCCGAC AACCTCCAGG CGCGGACACT GCTGGCAAGG 
GCGCTGGAAC GCGAAGGATT GAATCAGCAG GCCCTCGATG TCGCAGGCCA GTGGGCGCAA 
TCCGCATCCG CGTCGCGCTA TCTTCTTATG GTCACGGCGG ATGCGCTGTC CGGGCTCAGG 
CGAAAGCGCG AAGGCGAACA ATTGCGAGGG CGCGCTGCGC GAGCGGAGCC AGTGCCTGCG 
ACGGTCATCC CGACAGGACA GCCCCTTGGC GCCCTGGCCA TTGGCTATGG ACAGTCGCCG 
AACCTTGCCG CCACCGCCGT GCCCTACATT CGCGGGTTGA TCGAGGCGGG AAGTGCGGGC 
GAAGCGGTTG CCGTTGCAGA CCGGCTGCGT CAGGCCAGCC CCGGCGCGGC GGGAGCCTGG 
CTTCTTGCCG GCGATGCGCG CCTCATGTCC GGGGATTTCG CCGAGGCGCA GGAAATGTAT 
GGGCGCGCTG CCGTCATTCG TTTCAACCTT CCGACGCTTC AGCGCATCGA CCTGGTTCTG 
AGGCGTCAGG GCAAGGCTGC CGAGGCCAAT GCACTCGTCG CGCGCTATCT CTGGCAGAAT 
CCCGGCAGTC CGCAGGCGAT GAAGCTGCTT TCGGCGGGGC GCGCCGAACT GGGCGATGCG 
GCGGGCGCCG CCATGATCGA GGCGGTGCTG CGCGCCAGGG GCCTGCGCAA TCCGTCATGA

Protein sequence

MPLRQALRQG VPLTEVRAEL GDALLLQGNR QEARKVLYGG AFPSGTEARG WRLKGRLELV 
EGNLGAAGYA FDQALRLAPD ESSLWIDIAR LRFMGGEEAQ AIEAADRAVR LAPRDPRSLE 
LRGLLVREQF GLRAALPWFE AGLAAAPDDT GLLGEYAATL GDLGQYRAML VVCRKLAKVD 
PGNLRALYLQ AVLAARAGRI DLARKIMQQT GTAFRDVPAA MLLNGLLEYQ AGNANLAVGY 
FDRLVRAQPD NLQARTLLAR ALEREGLNQQ ALDVAGQWAQ SASASRYLLM VTADALSGLR 
RKREGEQLRG RAARAEPVPA TVIPTGQPLG ALAIGYGQSP NLAATAVPYI RGLIEAGSAG 
EAVAVADRLR QASPGAAGAW LLAGDARLMS GDFAEAQEMY GRAAVIRFNL PTLQRIDLVL 
RRQGKAAEAN ALVARYLWQN PGSPQAMKLL SAGRAELGDA AGAAMIEAVL RARGLRNPS