Gene Saro_1008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1008
Symbol
ID	3915790
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1050070
End bp	1051209
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	64%
IMG OID	640443742
Product	hypothetical protein
Protein accession	YP_496287
Protein GI	87199030
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2152] Predicted glycosylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCAGT TCCCGTTCGA CCGCCTGGTC TTCACCCCCT TCATGGTCGA CCTGGAGCGT 
TCTCCGCTGC GGGGGCATTT CGGCGAGGAA ACCTATGTCC TGGGTGCGTT CAATCCTGGG 
ATGACGGTCC TGCCGAACGG CAACCTCGTG TTCATGGTGC GCATTGCCGA GGCGCTTCGC 
CAGCCGATCC GCGACGGCAA GGTCCACGCG ATCCGGTGGG AAGACGGCGG CTACGTCCTC 
GACGGCTGGC CGCTTGAACT GGTCGACACT TCCGATCCGC GCAAGTTCCT GCTCCACGGC 
GGCGGCTGGA AGATCATGGC GCTGACCTCG TTGTCATGGC TGCTGCCGGT CGAAATGTCG 
CCCGACGGGC TCGACGTGAT ATCCATCCAC TATGACAAGG CCATCGCGCC GCAAGGTTCG 
CATCAGTGCT ATGGCATCGA GGACGCGCGC ATCTCGCGCA TGGGCGAGGG TGCCTATCTG 
ATGACCACCT GTTCGGTCAG CCCCGAGCGC CATTCGACGA CGCTCTACTC CTCGGACAAC 
GGGCTCGACT GGACATTCGA GGGCATCGTC CTCGATCACC AGAACAAGGA CATGTTGATC 
TTCGAAGGCC TGATCCACGG TGAATACTGG GCTCAGACGC GCCCGCTCGG AGACCTCTAT 
TTCGCCTACC CGCCGGGCAG CGAATGGCGC TCCGGCCCGT CGATAAATCT GTCGACCTCG 
CCCGATGCCC TTCACTGGAA GCCCTGCCTC AAGCCTGGCA TCCGGCCCCA CGCCGGCACG 
GCGGCAACCG CGCGCATGGG CGGCGGCACG CCGCCGATCC TCACCGAGAT CGACGGCAGG 
CGCGGCTGGC TGAGCCTGTG GCACGGGGTG GAGCCCAAGG AGATCGTCGG CATCTATCGC 
ACCTACTGGT CGCTGCTCGA TCCGGACGAT CCGTCGATCG CCATAGCCGC AAGTCATGCG 
CCGCTGCTTG AACCGGACGC GGAACTGACC CGCCCGCTTG AAGACCTGCT TTACCTGCGC 
GACGTGGTGT TCACCACCGG CATCGCGGAA GTCGGTGATC GCTTCATCGT GGCCTCGGGC 
GAGGCCGATC TTGCCTGCCG CATCACCCAT GTGCCGAAGG AAGCCTTCCG TTCCGCGTGA

Protein sequence

MTQFPFDRLV FTPFMVDLER SPLRGHFGEE TYVLGAFNPG MTVLPNGNLV FMVRIAEALR 
QPIRDGKVHA IRWEDGGYVL DGWPLELVDT SDPRKFLLHG GGWKIMALTS LSWLLPVEMS 
PDGLDVISIH YDKAIAPQGS HQCYGIEDAR ISRMGEGAYL MTTCSVSPER HSTTLYSSDN 
GLDWTFEGIV LDHQNKDMLI FEGLIHGEYW AQTRPLGDLY FAYPPGSEWR SGPSINLSTS 
PDALHWKPCL KPGIRPHAGT AATARMGGGT PPILTEIDGR RGWLSLWHGV EPKEIVGIYR 
TYWSLLDPDD PSIAIAASHA PLLEPDAELT RPLEDLLYLR DVVFTTGIAE VGDRFIVASG 
EADLACRITH VPKEAFRSA