Gene Saro_3278 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3278
Symbol
ID	3915925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3497425
End bp	3498555
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	66%
IMG OID	640446063
Product	peptidase M14, carboxypeptidase A
Protein accession	YP_498547
Protein GI	87201290
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2866] Predicted carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.546138
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGACA TCCGCATCAA CGCCGCATTC GATTCCGGCA ACATCGAAGT CCTTGCCACC 
CGGGGCGCGA CGGCCCGACT GGCGATCCGC AAGGACCGGG AATCCGACTT CTTCCAGTGG 
TTCCATTTCC GCGTCGACGG CGCGGATGAC CGCGAGCTCG AGCTGAAGAT CACCGGGCTC 
GAGGCTTCCG CCTATCCCGG CGGATGGCCT GGCTATCGCG CGGCGGTCTC GCAGGATCGG 
GAGATATGGA GCCGCGCCGA ATCGCACTAC GATCCGCGCG AGGACGGGGG CACACTGACG 
ATCCGGCACA GGCCCGAGGC GGGACCCTGC TGGTTCGCAT ACTTCGCGCC CTATTCGATG 
GAGCGGCACC ACGATCTCGT CGCCGCCACG GCAGGCTGCG ACGGCGTCGA ATACCGGTGC 
CTGGGAACGA GCGTCGAGGG CCAGCCAGTC GACTGCCTGG TCATTGGCGA GGGGCCGAAG 
CAGGTCTGGC TCTACGCGCG GCAGCATCCC GGCGAATCGA TGGCCGAATG GTGGATGGAA 
GGCGCGCTCG ACATGCTGAC CGACCCGGCC GATCCGCATG CGCGGCGGCT GCGCCAACTC 
TGCCGGTTCC ACATCGTACC CAATGCCAAT CCCGACGGTT CGTGCCGGGG CCATTTGCGG 
ACCAATGCAG TAGGCGTGAA CCTCAACCGC GAATGGCACG AGCCGAGCGC CGCCAGATCG 
CCCGAGGTTC TGGCGATCCG CAACGCGATG GACGAGAGCG GCGTGGACTT CGCCATGGAC 
GTCCACGGCG ACGAGGCGAT CCCGCACGTG TTCCTCGCGG GGTTCGAGGG CATCCCTTCC 
TGGACCGACG AGCTGGGCGA AGGATACGCG CGCTATCGCC GCATCCTCGA ACGACGCACG 
CCGGACTTCC AGACGAAGCG CGGTTATCCG GTTGCCGCAC CTGGGCGGGC AAACCTGTCG 
ATGTCGACCA ACCAGGTGGC GGAACGCTTC GGCTGCGTGG CGATGACGCT GGAAATGCCG 
TTCAAGGACA ACGACGACCT GCCCTGCAAG GCCCAGGGAT GGAGCCCGGA CCGCAGCAAG 
CTGCTGGCGC GCGAATGCCT GGCAGCGCTG CTCGAATGGT TACAGGACTG A

Protein sequence

MTDIRINAAF DSGNIEVLAT RGATARLAIR KDRESDFFQW FHFRVDGADD RELELKITGL 
EASAYPGGWP GYRAAVSQDR EIWSRAESHY DPREDGGTLT IRHRPEAGPC WFAYFAPYSM 
ERHHDLVAAT AGCDGVEYRC LGTSVEGQPV DCLVIGEGPK QVWLYARQHP GESMAEWWME 
GALDMLTDPA DPHARRLRQL CRFHIVPNAN PDGSCRGHLR TNAVGVNLNR EWHEPSAARS 
PEVLAIRNAM DESGVDFAMD VHGDEAIPHV FLAGFEGIPS WTDELGEGYA RYRRILERRT 
PDFQTKRGYP VAAPGRANLS MSTNQVAERF GCVAMTLEMP FKDNDDLPCK AQGWSPDRSK 
LLARECLAAL LEWLQD