Gene Saro_1949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1949
Symbol
ID	3917264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2066623
End bp	2067942
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	65%
IMG OID	640444696
Product	peptidase M28
Protein accession	YP_497223
Protein GI	87199966
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAACGA TGCTTGTCCT GATCCCGCTG CTGGCACCGA CCATTGCGCG GGCCGCACCC 
GAAGATGCCG TTTCTCAGGC GCGGCTTCGT GCTGACGTGG AGAAGCTGGT CAGTTTCGGC 
ACGCGGCATA CCCTGTCCTC GCAATCCGAT CCGAGGCGCG GAATCGGGGC TGCTCGAAAA 
TGGGCTGAAG CCGAATTTCG CAAGGCATCG GCCGCCTGCG GCAGTTGCTT CGAGATCGTG 
TTGCCTGAAA CCGTGGTGAG TGGCGACCGA GTGCCGGTGC CGACGCGGTT GGTCGATGTG 
GTGGCGATCC AGCGCGGGAC CGAGCGGCCC AACGAGGTTG TGATTGTCCA GGGTCACATC 
GACAGCCGCG TTTCCGATGT TCTCGATGCG GTTAAGGACG CGCCGGGCGC GAACGACGAC 
GCTTCAGGCA CCGCGCTGGT GCTGGAAGCG GCACGGGTGC TCTCGAAGGA GCGCTTTCCG 
ACCACCGTCG TCTATGCAGT ACTTTCGGGC GAGGAACAGG GGCTGCTCGG CGGCAAGCTG 
CTGGCTGATT ATGGTGCGCG GCAGGGATGG ACCGTGAAAG CCGTCCTCAA CAACGATATC 
GTCGGTGGAT CGACCGGATC GGACGGGTAC CGGGACGATA CGCATGTGCG GGTGCTATCC 
GAAGGGCCGC GTGCCGACGC TACCGATGCC CTGCGCGCGC AGATGCGGCG TTATGGCGGC 
GAGAACGACA GCCCTTCGCG CAACATCTCG CGCTGGCTGG CAGGGCTAGC CGAGGCGGAC 
GCGAAGGGCT TGGCGGTGCG GCAGGTCTGG CGCGCGGACC GGCTTGGCCG GGGCGGGGAC 
CAACTGCCGT TTTCTGACAG GGGCTTTCCC GCCGTGCGTT TTACCGTCGC CGTGGAGGAT 
TACGAGCACC AACATCAGGA CTTGCGCACC GAAGGCGGAG TGAAGTTCGG CGATACCATG 
GACGAGATGG ATTTTCCCTA TCTGGCGAAA GTGACGAGGC TCAACGTACG GGCGCTGGCG 
AGGCTGGCAC GGACGCCTAT GCCCCCGGCT CCGGTGGTCA AAGGTGCAGT GCAGCCAAGT 
ACCGACGTGG AGTGGCAGGC GGTGCCCGGC GCGTTTCGCT ATGTGCTGTG GCAACGGAGG 
ACCGATGCGC CGATGTGGGA GACCCGCTTG CTGGAAACGG GTGACCTGAA AGCCAGTCTC 
AAGGGCGTGC GCGCTGACGA CTGGCTGTTT GGCGTGAGCG CCATGGCGGC GGACGGTAGC 
GAAAGTCCGA TTGCCTCGGC GGTGCCTGGC GGGCAGTTCG CCCCGCTGGC GAAACCGTAA

Protein sequence

MRTMLVLIPL LAPTIARAAP EDAVSQARLR ADVEKLVSFG TRHTLSSQSD PRRGIGAARK 
WAEAEFRKAS AACGSCFEIV LPETVVSGDR VPVPTRLVDV VAIQRGTERP NEVVIVQGHI 
DSRVSDVLDA VKDAPGANDD ASGTALVLEA ARVLSKERFP TTVVYAVLSG EEQGLLGGKL 
LADYGARQGW TVKAVLNNDI VGGSTGSDGY RDDTHVRVLS EGPRADATDA LRAQMRRYGG 
ENDSPSRNIS RWLAGLAEAD AKGLAVRQVW RADRLGRGGD QLPFSDRGFP AVRFTVAVED 
YEHQHQDLRT EGGVKFGDTM DEMDFPYLAK VTRLNVRALA RLARTPMPPA PVVKGAVQPS 
TDVEWQAVPG AFRYVLWQRR TDAPMWETRL LETGDLKASL KGVRADDWLF GVSAMAADGS 
ESPIASAVPG GQFAPLAKP