Gene Sros_3174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3174
Symbol
ID	8666462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	3456202
End bp	3457401
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	65%
IMG OID
Product	Zn-dependent dipeptidase microsomal dipeptidase
Protein accession	YP_003338862
Protein GI	271964666
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.845004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.812253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTCAC CATCCGCCTC TTACCGCGGT CACCAGGCCT ACGGCTATCT CGAGCCGGGC 
GTCGACTACG CCGACTTCGA GCTGGCCGAG CAGATCGGCC GAGTGCCCGC CTACGACGGT 
GGGGTGTCGG CCGAGCAGTC CGAACGGGTC AGCCGGATCA TGGCCGAGCA CATCGTGATC 
TCACTGCACG AGCACGCGGT GGTCCTGCCC AAGGACGTCG GTGAACTGCG CCGGTACAAC 
CGCACCGGCC GGCAGCGTAC GGGCTACGAA GGTCTGTCGC GTTCGGGCAT GACGGCCGTG 
TTCGACAACT TCATGGCCGG GGCGTCGTGC GTCACCAGCG AGAACGGCTG GAAGTGGAAC 
GACATGATCT ACGCCCTCGG CCTGCGGCTC GCGGACATCG CCAAGCAGGA CTACGTGGTG 
CACGCGCTGA CGGTGGACGA CATCAGGGCA GCCAAGCGCG ACGGCCGGAT GGCGCTGGTG 
GCCGGGCTGG AGTCGGCGAC GATGATCGAG AATGAGCTCG ATCGTCTGGA CATCCTGTAC 
GGCTTCGGGG TCCGTCAGAT CGGTGTCGCG TATTCGCAGG CCAACCAGTT GGGTTCGGGG 
TTGGCCGAGC GGGCCGATGC CGGTCTGACC AATTTCGGCC GTCGTGCGGT GGAGCGGATG 
AACCGGCTCG GTATGGCGAT CGACATCTCG CACTCGGGTG ACCGTACGTG TCTGGAGGTC 
ATCGAGCATT CGGCGGTGCC GGTCTTCATC ACGCATGCCG GTGCTCGTGC GGTGTGGCCG 
ACCAACCGGA TGAAGCCCGA TGAGGTGATC AGGGCGTGTG CCGAGCGTGG TGGTGTGATC 
GGTCTGGAGG CGGCTCCGCA CACCACGCTG TCGGAGGAGC ATCGCGAGCA CTCGCTGGAG 
TCGGTGATGG ATCACTTCAC CTACTGCGTG GACCTGGTGG GCATCGACCA CGTCACCTTC 
GGCCCCGACA CGATGTTCGG CGACCACGTG GGGGTGCACA AGACCTACGC CGGCAACTAC 
GCCCAGAACC GCGACGCCGC GCCCGACCAC CCGAACGTCG CCTACGTGGA CGGCCTGGAG 
AACCCGGCGG AGAACTTCAC CAACATCGTC GGCTGGCTCG TCAAGCACGG CTACGGCGAT 
GATGACATCA GCAAGGTCAT TGGCGGAAAC ACGCTCCGCG TGCTCGATCA TGTCTGGTAG

Protein sequence

MQSPSASYRG HQAYGYLEPG VDYADFELAE QIGRVPAYDG GVSAEQSERV SRIMAEHIVI 
SLHEHAVVLP KDVGELRRYN RTGRQRTGYE GLSRSGMTAV FDNFMAGASC VTSENGWKWN 
DMIYALGLRL ADIAKQDYVV HALTVDDIRA AKRDGRMALV AGLESATMIE NELDRLDILY 
GFGVRQIGVA YSQANQLGSG LAERADAGLT NFGRRAVERM NRLGMAIDIS HSGDRTCLEV 
IEHSAVPVFI THAGARAVWP TNRMKPDEVI RACAERGGVI GLEAAPHTTL SEEHREHSLE 
SVMDHFTYCV DLVGIDHVTF GPDTMFGDHV GVHKTYAGNY AQNRDAAPDH PNVAYVDGLE 
NPAENFTNIV GWLVKHGYGD DDISKVIGGN TLRVLDHVW