Gene Sros_5063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5063
Symbol
ID	8668357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5588075
End bp	5589220
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	74%
IMG OID
Product	amidohydrolase
Protein accession	YP_003340596
Protein GI	271966400
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.304888
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.655587
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTACTT TGATCCGCGA CGTCAGCGTG TTCGACGGCG AGCGCACCAT CGCGACGGCC 
GACGTGGTGC TGGACGGCGA TCGGATCGCC GTGGTCGGCA CCGGTGCGGG CCACCGGGCC 
GACGTCGAGG TCGCCGGGGC CGGCAGGACG CTCCTTCCCG GGTTGATCGA CGCGCACACC 
CACGTCTTCG ACGGCAGCCT GGCCGAGGCC CTGCGCTACG GGGTCACCAC CGAACTCGAC 
ATGTTCTGCC TCCCGCAGAT GCTGCCGCGG CAGCGGCGGC TGGCCGCCGA GAACGACGAC 
GTGGCCGACT TTCGCAGCGC GGGCACCCTG GCCACCGCGC CCGGCGGGCA CCCGACCCAG 
CTGCTGGCGG CCCTGGCCGG CACCGTCCTG GACGGCATCG ACGCGACGGC GATCGACTTC 
GTCTCCGATC CGGCGCAGGC ACCGGCCTTC GTGGCGGCCA GGCTGGCCGA GGGAGCCGAC 
TACCTCAAGA TCGTCATCGA TGACGGTACG GTGCACGGCG CCGACCTCCC CGTGATGACG 
CCGGAGATCG CCGCCGCCCT CGCCGCGGCG GCACACGACG CCGGACTGCG GGTCATCGCT 
CATGCGATCA CCGCATCCGA AGCGACGATC GCGCTGGACG CCGGCGTGGA CGGACTGGCC 
CACGTGTGGA CCGACCTCGC GCAGGACGAC CCGGCCTCGC AGCGGCTGGC CGAGCGGGTC 
CGCGCCCAAG GGGTCTTCGT CGTGACCACG CTCGCCTACT TCGAGGCGAT CACCGCTCAA 
CACCTCGAGA CCGCCGACTG CGCCCGTCCC GGCAGCTCCG CCAACGCCGT CGGCGCGCTG 
CGGGCCCTGC GCCAAGCCGG CGTGCCCCTG CTCGCCGGGA CCGACGCCAC CCCGTTCGCG 
CCCGCCCACG GCGCCGGCAT GCACCGCGAG CTGCACCTTC TCACCGAGGC CGGGCTCAGC 
GCCGAAGAGG CGCTCGCCGC CGCGACCAGC CTCCCCGCGT GCCACTTCGG CCTGACCGAC 
CGCGGCCGGA TCGCCCCCGG CCTCCGCGCC GACCTGGTGC TGGTCGAAGG CGACCCCACG 
CGAGACATCA CCGCCATCGC CGCCATCACC GACGTCTGGC GCCGCGGAGT GCGCCAGACC 
CGCTAG

Protein sequence

MRTLIRDVSV FDGERTIATA DVVLDGDRIA VVGTGAGHRA DVEVAGAGRT LLPGLIDAHT 
HVFDGSLAEA LRYGVTTELD MFCLPQMLPR QRRLAAENDD VADFRSAGTL ATAPGGHPTQ 
LLAALAGTVL DGIDATAIDF VSDPAQAPAF VAARLAEGAD YLKIVIDDGT VHGADLPVMT 
PEIAAALAAA AHDAGLRVIA HAITASEATI ALDAGVDGLA HVWTDLAQDD PASQRLAERV 
RAQGVFVVTT LAYFEAITAQ HLETADCARP GSSANAVGAL RALRQAGVPL LAGTDATPFA 
PAHGAGMHRE LHLLTEAGLS AEEALAAATS LPACHFGLTD RGRIAPGLRA DLVLVEGDPT 
RDITAIAAIT DVWRRGVRQT R