Gene Saro_0079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0079
Symbol
ID	3918510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	81777
End bp	82778
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	70%
IMG OID	640442804
Product	hypothetical protein
Protein accession	YP_495362
Protein GI	87198105
COG category	[S] Function unknown
COG ID	[COG1426] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCCGAAG CCGGCGGTCT TAACGACATC AGCAATATCG ACACTACCCC GTTCCCCGCC 
GGCGAGCCAC GCCGTGGCGG CGTGGGCGAG ACCTTGCGCG CCGCGCGCGA GGCGGCGGGT 
CTGGACATCA AGCAGCTTTC GCTGAGGACG CGCGTCACGA CGCGCCATCT CGAAGCGCTC 
GAAAGTGGCG ACTATTCGGT CCTGCCGGGC CGCCCCTACG CGCTCGGCTT TGCCAAGAGC 
TATGCCCGCG CGGTGGGCCT TGACGACAAG GCCATCGGGG AGGCCGTCCG TGCCGAACTG 
AACCGGCAGG CGCCGCCGCC GCCGCCGCGC GTCATCAACC AGTTCGAGGT GGGCGATCCG 
ATCAAGACGC CCTCGCGCCT GACAGGCTGG CTTGCTGCCG GTCTGGTCGT GGCGATTGCG 
GCTGCGGGCC TCACCTTGTG GCGCAGCTAT TACCTGCCGT CGGCGGAACT GCCCCCGCTG 
GTCGGTGCCG AGGAAGCCAG TCCCGCGCCC TCGCAGGTCG CGGTTGTCCC GCTGCCCAGC 
GCCGCGCCTT CGGGCCCGGT GGTCTTCACC GCCCGCGAGA ACGGGGTCTG GGTCAAGTTC 
TACGACGGTC AGGGCCAGCA GATCCTCCAG AAGGAACTCG CCAAGGGCGA GACCTTCACC 
GTGCCCTCTG GCGCACAGAA TCCGATGCTC TGGACAGGGC GGCCCGATGC GCTTGACATC 
ACCGTCGGCG GGCAGGCCGT ACCGCGTATC GCCGAACGCG AAGGCATCGT GAAGGACGTG 
CCGGTCAGCG CCGCCGCACT CATGGCGCGT GGCACCACGC CTGCGCCCGC CGCCGTCTCG 
GCGGGGGCAG AGCAGACCTC GCAAGTGGCG CCATCCGCGC CTCGCCCGCG TCCGGCCGTT 
GCGCGTCGTC CGGTGGTGGC GCAGCCGTCC GCCTCACCCG TTTCGGATCT TCGCCCCGCG 
GAAAGCACGG AAACGGTTGC GCCTTCCACC GGAATGAATT GA

Protein sequence

MAEAGGLNDI SNIDTTPFPA GEPRRGGVGE TLRAAREAAG LDIKQLSLRT RVTTRHLEAL 
ESGDYSVLPG RPYALGFAKS YARAVGLDDK AIGEAVRAEL NRQAPPPPPR VINQFEVGDP 
IKTPSRLTGW LAAGLVVAIA AAGLTLWRSY YLPSAELPPL VGAEEASPAP SQVAVVPLPS 
AAPSGPVVFT ARENGVWVKF YDGQGQQILQ KELAKGETFT VPSGAQNPML WTGRPDALDI 
TVGGQAVPRI AEREGIVKDV PVSAAALMAR GTTPAPAAVS AGAEQTSQVA PSAPRPRPAV 
ARRPVVAQPS ASPVSDLRPA ESTETVAPST GMN