Gene Saro_0714 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0714
Symbol
ID	3918538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	754513
End bp	755670
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	65%
IMG OID	640443446
Product	hypothetical protein
Protein accession	YP_495995
Protein GI	87198738
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCTCT ACGAACCGTT CCCGAACTAC ATCTGGAATC TCTCGGTTTC GATCGCGATG 
GAGAGCGGCG GGCAGATCGG CGAAATCGTC GACATGTGCC AGCCGATTAT CGATGCCGCC 
TCCAACGGCG GCGATGCCGG CACGCCGCAG TTCATGAAGC AGTGGGCCGC CTATGGCGAC 
AAGCTGATCG CGCTTGCCGC CGAGGACGAG GCTAGGGGGC GCATGTTCTC CGCCTCGAAC 
AAGCTCGAGC GGGCTTCGCT CTACCTGCTG GTGGCAGAGC GCATGCAGGG TCATGGCGCA 
CCGGGCCGCA AGGAGAGCTA TGCGAAGGCG CGCGATGCCT TCGACAAGTC CACCGCGCTC 
GGCAAGATCA ACCGCGAGCG GGTGGAGATC CCGCTCGGCA AAGGCACGAT GCCCGCGCTC 
TACACTCGCG CGCCGGGCAA CGGCCCACAT CCGGTTGTCG TTTATTGCAA CGGCCTCGAT 
AGCTGCAAGG AGCTGCTCTA CTGGAGCCGC CTGCCCGAAG CGCTGGCCCG GCGCGGCATT 
TCGACAATCT GCGTCGACCA GCCCGGTTCG GGCGAGGCCC TGCGCCTCCA GGACCTGCCG 
GTAGACCCGC ATTCGGAGAA CTGGGCCTCG AAGGCGGTGG ACTGGCTGGA GCAGCAGCCC 
GACGTCGACC CCAAGCGCAT CGGCATGACC GGCATCAGCC TCGGCGGCCA CTTCGCCCCC 
CGCGCCGTTG CCTACGAGCC GCGCTTTGCC TCGGGCGCGG TATGGGGTGC CAACCACAAC 
TGGCGGGAGG TGCAGGACAA GCGCCTCAAG CGCGAAGGCG AAAACCCGGT GCCCCACTAT 
TGGGCGCATG TGATGTGGGC GTTCGGTGCC AGCGACATGG ACGATTTCAT GGTCAAGTCA 
GAGGACATGA ACCTGAATGG CCACATGGAC CGGATCAAGG TGCCGTTCCT CGTCACCCAT 
GGGGCCGACG ACCGCCAGAT CAGCGTTTCC TACGCCGACG ACCTCTATGA CCAGCTCGTC 
AATTCGCCGC GCCGCGAGAA GGTGATCTTC ACCGCCCGCG AAGGTGGCGT CGAACACGTC 
GGCGCCGACA ACATGGCCTA TGGCCGCGAC TGCATTGCCG ACTGGTTCGC CGAGACGTTG 
GGCGGTACGA CTGCCTGA

Protein sequence

MALYEPFPNY IWNLSVSIAM ESGGQIGEIV DMCQPIIDAA SNGGDAGTPQ FMKQWAAYGD 
KLIALAAEDE ARGRMFSASN KLERASLYLL VAERMQGHGA PGRKESYAKA RDAFDKSTAL 
GKINRERVEI PLGKGTMPAL YTRAPGNGPH PVVVYCNGLD SCKELLYWSR LPEALARRGI 
STICVDQPGS GEALRLQDLP VDPHSENWAS KAVDWLEQQP DVDPKRIGMT GISLGGHFAP 
RAVAYEPRFA SGAVWGANHN WREVQDKRLK REGENPVPHY WAHVMWAFGA SDMDDFMVKS 
EDMNLNGHMD RIKVPFLVTH GADDRQISVS YADDLYDQLV NSPRREKVIF TAREGGVEHV 
GADNMAYGRD CIADWFAETL GGTTA