Gene Saro_3261 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3261
Symbol
ID	3917519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3482170
End bp	3483354
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	66%
IMG OID	640446045
Product	peptidase M19, renal dipeptidase
Protein accession	YP_498530
Protein GI	87201273
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.35092
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCGCA AGATTGGCTG GGCAGTGATC TTCATTGTCC TGTTTGCCGC CGCCTTCGTG 
CTCGGCCCGC TGCCGGCGAT GGTCGAGAAG CGGATGAACG TGATCGACGG CCAGCCGCTG 
CTGACCGTCA GCGAAAGGGC CAAGGCGCTT CACCGCACGT TGACGATCGT CGACCTTCAT 
GCCGACACGC TGATGTGGCG CCGCAACCTT ACCGACCGCG CTGCCCAAGG CCATGTCGAC 
CTGCCGCGCC TGATCGACGG GCACGTTGCG CTCCAGGTCC TGTCGTCGGT CACAAAATCG 
CCCAAGGGAC TGAATTACGA CGCGAATCCT TCGAACAGCG ATACCATCAC CGCGCTTGCC 
GTCACCCAGA TGCAGCCGGT ACGCACATGG AATTCGCTAC TCGAGCGGTC GCTCTGGCAT 
GCCGAAAAGC TCGACCGCGC GGTGGCCGGC TCCAGCGGCG AACTGGTCAA GGTCACTGGC 
CAGGCTTCGC TCGACGATCT GCTGCGCGAA CGCGGCGAGG GCGCGCTGCC GGTCGGTGCG 
ATGCTTTCGA TCGAGGGACT CCACGATCTC GAGGGCAAGC GCGAGAACCT CGACCGGCTC 
TACGACGCGG GCTTCCGCAT GGCGAGCCTG ACACACTTCT TCGACAACCA GCTCGCCGGG 
TCGATGCACG GCGAACGGAA GGGCGGCCTA ACTCCGTTCG GGCGGCAGAT CGTGCGCGCG 
ATGGAAGACA AGGGCATGAT CGTCGACATC GCCCACCTGT CGCATCCCGG CGTTGCCGAG 
CTGCTTGCCA TGGCCCGCCG CCCGGTCGTC TCCAGCCACG GCGGCGTCCA GGCCACCTGC 
AAGGTCAACC GCAACCTCAC CGACGCAGAG ATTCGCGGCG TCGCCCGCAC GGGCGGGGTG 
ATCGGCATCG GCTACTGGGA TGCCGCCATC TGCGACACAT CGCCCCGCGC CGCCGCGCGC 
GCCATGCGCC ATGTGCGCGA CCTTGTCGGC ATCCAGCATG TCGCGCTGGG CAGCGACTTC 
GACGGCGCCA CCACCACCCG CTTCGATACC TCGCAGCTCG AACAGGTGAC CCAGGCCCTG 
CTTGACGAAG GCTTCAGCGA CGACGAAATA CGCGCCGTGA TGGGGCTCAA CGCACTTCGG 
GTGATCCGCG CCGGGATCGT TCCGCTGGGA GGCGGCGCAC GGTGA

Protein sequence

MRRKIGWAVI FIVLFAAAFV LGPLPAMVEK RMNVIDGQPL LTVSERAKAL HRTLTIVDLH 
ADTLMWRRNL TDRAAQGHVD LPRLIDGHVA LQVLSSVTKS PKGLNYDANP SNSDTITALA 
VTQMQPVRTW NSLLERSLWH AEKLDRAVAG SSGELVKVTG QASLDDLLRE RGEGALPVGA 
MLSIEGLHDL EGKRENLDRL YDAGFRMASL THFFDNQLAG SMHGERKGGL TPFGRQIVRA 
MEDKGMIVDI AHLSHPGVAE LLAMARRPVV SSHGGVQATC KVNRNLTDAE IRGVARTGGV 
IGIGYWDAAI CDTSPRAAAR AMRHVRDLVG IQHVALGSDF DGATTTRFDT SQLEQVTQAL 
LDEGFSDDEI RAVMGLNALR VIRAGIVPLG GGAR