Gene Sros_0422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_0422
Symbol
ID	8663690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	422027
End bp	423274
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	67%
IMG OID
Product	Formamidase
Protein accession	YP_003336194
Protein GI	271961998
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0857845
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGAAG TCGTGTTCAG CGTGGACCAG TCGAAGTCGA TGCGTGACCA GGCCGTGCCG 
GGTCACAACC GATGGCATCC GGACATACCC GCGGTCGCCA TGGTGCGACC TGGGGACGAG 
TTCCGCGTCG AATGCCGGGA ATGGACCGAC GCGCAGTTAC ACAACGACGA CTCGGCCAAC 
GACGTGCGAG ACGTCGACCT CACCCTCGCG CACATGCTGA GCGGCCCGAT CGGGGTGGAG 
GGGGCGGAGC CGGGAGACCT CCTGGTGGTC GACATCCTCG ATCTCGGTCC GGTACCCCAG 
CAGACCGGCG ACGCGCCGGG ACAGGGCTGG GGCTACACCG GGGTGTTCGC CAAGGTGAAC 
GGTGGCGGCT TCCTGACCGA CTACTTCCCG GACGCCTACA AGGCGATCTG GGATTTCCAT 
GGCATATACG CGACATCTCG CCACCTGCCC GGCATCCGGT ATGCCGGCAT CACCCACCCC 
GGGCTGTTCG GCACGGCGCC GTCGGCGGAG CTGCTGGCCA GCTGGAACCA GCGCGAGCAG 
GCTCTCATCG ACACCGACCC CGACCGGGTC CCGGCCCTGG GCCTGCCGCC GCTGCGCGAC 
AACGCCCTCG CCGGAACGGC GACCGGTGAC GTGGCCGACC GGATCGCCAG GGAGGGGGCC 
CGCACCGTTC CCGCACGGGA GAACGGCGGC AACCACGACA TCAAGAACTT CACGCGCGGG 
GCACGCGTCT TCTACCCCGT CCACGTGAAG GACGCCAAGC TCTCGGGAGG GGACCTGCAC 
TTCAGCCAGG GCGACGGCGA GATCACCTTC TGCGGGGCGA TCGAGATGGG GGGCTTCATC 
GATTTCCACG TGGACCTCAT CAAGGGGGGC ATGGAGAAGT ACGGCGTCAC CACCAATCCG 
ATCTTCATGC CCGGCAACGT CGAGCCGCGG TACTCCGAGT TCATGTCGTT CATCGGCATC 
TCGGTCGACC ACGACACGAA CACGAACTAC TACCTCGACG CGACGGTGGC CTACCGCCGA 
GCCTGCCTCA ACGCCATCGA ATACCTCAAG AAGTGGGGCT ACACGGGCGA GCAGGCCTAC 
CTGCTCCTCG GGTCGGCGCC CATCGAGGGC CGGATCAGCG GCATCGTCGA CATCCCCAAC 
GCCTGCTGCT CGCTCTACCT GCCCACCGAG ATCTTCGACT TCGACGTGCG CCCGAACGCG 
GAGGGCCCCG TCAAGAAGGA CAGGGGGCAG TGCGCGGTGA CGTCCTGA

Protein sequence

MPEVVFSVDQ SKSMRDQAVP GHNRWHPDIP AVAMVRPGDE FRVECREWTD AQLHNDDSAN 
DVRDVDLTLA HMLSGPIGVE GAEPGDLLVV DILDLGPVPQ QTGDAPGQGW GYTGVFAKVN 
GGGFLTDYFP DAYKAIWDFH GIYATSRHLP GIRYAGITHP GLFGTAPSAE LLASWNQREQ 
ALIDTDPDRV PALGLPPLRD NALAGTATGD VADRIAREGA RTVPARENGG NHDIKNFTRG 
ARVFYPVHVK DAKLSGGDLH FSQGDGEITF CGAIEMGGFI DFHVDLIKGG MEKYGVTTNP 
IFMPGNVEPR YSEFMSFIGI SVDHDTNTNY YLDATVAYRR ACLNAIEYLK KWGYTGEQAY 
LLLGSAPIEG RISGIVDIPN ACCSLYLPTE IFDFDVRPNA EGPVKKDRGQ CAVTS