Gene Saro_3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3066
Symbol
ID	3916680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3284809
End bp	3286107
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	70%
IMG OID	640445848
Product	Sel1 repeat-containing protein
Protein accession	YP_498335
Protein GI	87201078
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAGCAG GACGGCGCGG CGCAGGACGG CGCGGCGCAG GACGGCGCGG CAGGGGGCAG 
CGCGGCAGGG GGCAGCGCGG CAGGGGGCAG CGCGAGCGCT CCGTGCCAGC ACGGATCAGG 
AAACGGACTT TGGTGGCAAT GGCTTCGATC GGGTTGAAAA CACGCGGCGG CGGGGCCTGC 
AGGCGACTTG CGCGATACCG GGTGCTGACC CTCGCGCTGG CAGCGATGGC CGTCGCCGCA 
ACGCCTGCCC GCGCCGATGT GAAGGCTGGC GTCGACGCGT GGTCGCGCGG CGATCACGCC 
GGCGCGGTCA AGGAATGGCT CGGCCCGGCA GCCAGGGGCG ATGCCGATGC GCAGTTCAAC 
ATGGGTCAGG CCTACAAGCT CGGGAAGGGC GTGACGCAGG ACCTGAAGCG CGCGGAAGCG 
TGGTATCGCA AGGCGGCCGA ACAGGGGCAC ATCAAGGCGG GAGACACGCT CGGCCTCCTG 
CTCTTCCAGG AAAACCGCAA GGCCGAAGCC CTGCCCTACC TGACGGCCTC GGCCTACCGG 
GGGGAGCCGC GCGCGATGTA CATTCTGGGC ATCGCCCACT TCAACGGGGA CACTGTCGGC 
AAGGACTGGG TGCGCGCCTA TGCGTTGATG AGCCGCTCGG CCGCGACCGG GCTCGACCAG 
GCGACGCGCG GATTGGCCAC GATGGACGAG ATCATCCCGC TCGACCAACG CCAGTTGGCG 
ATGTCGCTGG CCACGGAGCT GGAACAGAAG GCGCAGGCGA ACCGGGCAAG GGAATTTGCC 
GCAGCCGATC TTGGCGTGAA AGCAGGTGCG CCCGCGCCAA TGCGCCCGCA GCAGGCACCT 
GCTCCGCTCC AGCGCGCGGA ACTTCCGCCG TCAACGCCTT CGGTCGCCGC TCCCGTCACG 
GCGGGCGCCG ACTTTGCCGA TCCGGTTCCG ATACCGACGC CCCGTCGCGT TGCCGCGAGC 
CAGGCCAAGC CGGATGCCCC GCGCGAAGCC GCGCCACCCG CCGCAAGGGC AAAGCCCGCC 
GCGCCCACGC AACCCAGGAA GGCCGCACCC TCCGCTTCAG CACCCAAGGC AGACGGCAAC 
TGGCGCATCC AGTTCGGCGC ATTCGGAGTG AAGAGCAACG CCGACGCCCT GTGGGCGAAA 
GTGAGGAATC GCGCCGAAGT CGCAGGGCAT GCCCGGATCG ATCTGCCCGC AGGCGGCGTA 
TCGCGTCTTC TGGCGGGCGG CTACACCGAG AGCCAGGCCG ACAAGGCCTG CGCCGCGCTC 
AAGGCTGGCG GCTTCAGTTG CCTGGTGGTA AAGCCCTGA

Protein sequence

MAAGRRGAGR RGAGRRGRGQ RGRGQRGRGQ RERSVPARIR KRTLVAMASI GLKTRGGGAC 
RRLARYRVLT LALAAMAVAA TPARADVKAG VDAWSRGDHA GAVKEWLGPA ARGDADAQFN 
MGQAYKLGKG VTQDLKRAEA WYRKAAEQGH IKAGDTLGLL LFQENRKAEA LPYLTASAYR 
GEPRAMYILG IAHFNGDTVG KDWVRAYALM SRSAATGLDQ ATRGLATMDE IIPLDQRQLA 
MSLATELEQK AQANRAREFA AADLGVKAGA PAPMRPQQAP APLQRAELPP STPSVAAPVT 
AGADFADPVP IPTPRRVAAS QAKPDAPREA APPAARAKPA APTQPRKAAP SASAPKADGN 
WRIQFGAFGV KSNADALWAK VRNRAEVAGH ARIDLPAGGV SRLLAGGYTE SQADKACAAL 
KAGGFSCLVV KP