Gene Sros_2778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2778
Symbol
ID	8666064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	3017656
End bp	3019029
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	75%
IMG OID
Product	allantoinase
Protein accession	YP_003338479
Protein GI	271964283
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGCCG AAGATGTGAC GGACCTGGTC ATCCGGTCTC GCCGGGCCGT GCTCCCGGAA 
GGGGAGGGCC CGGCGGCGGT GGCCGTACGG CGGGGCAGGA TCGCCGGCCT GCACGCCTAC 
GACGCCGTCC TGGAGGCCGC CGAACAGGTC GACCTCGGCG ACACCGCGCT GCTGCCCGGC 
CTCGTGGACA CCCACGTGCA CGTCAACGAG CCCGGCCGGA CGCACTGGGA GGGCTTCGCC 
TCCGCCACCC GGGCGGCCGC CGCGGGCGGG GTCACCACGA TCGTGGACAT GCCGCTCAAC 
TCGCTGCCGC CGACGGTGGA CGTGGGCGCG CTGGCCGGCA AGCGGAGGGC CGCGGCCGGG 
CAGTGCCTGG TGGACGTGGG CTTCTGGGGC GGTGCGGTCC CCGGCAACGT CAAGGACCTG 
CGGCCGCTGC ACGAGGCCGG GGTGCACGGT TTCAAATGCT TCCTGTCGCC GTCCGGCGTG 
GAGGAGTTCC CGCCGCTGGA CGTGGACGGG CTGCGGGCGG CCATGGTGGA GATCGCCTCC 
TTCGACGGCC TGCTGATCGT CCACGCCGAG GACCCGGGGC TGCTCGCCGA ACCGGCCGGC 
CCCGGCTACG AGGAGTTCCT CGACTCCCGC CCCGGCCGGT CGGAGCGCCG CGCGGTCGAA 
CTGGTCGTCG CGCTGGCGGG GGAGACCGGT GTGCGGGCGC ACATCCTGCA CGTCTCCTCC 
GCGCTCTGCC TGGAACCCCT GGCCAGGGCG CGGCGGGAGG GCGTCAGGAT CACCGCCGAG 
ACCTGCCCGC ACTACCTGAC GCTGACGGCC GAGGAGGTGC CGCGGGGCGC GACCGAGTTC 
AAGTGCTGCC CGCCGATCCG GACCTCCGCC AACCGCGAGC GACTCTGGCG CGGGCTCGCC 
GACGGCGTGC TGAGCTGCGT CGTCTCCGAC CACTCACCGT CCACCCCGGA CCTCAAGGTG 
CCCGACTTCG CCGCGGCCTG GGGCGGGATC TCCTCCCTCC AGCTCGGCCT GGCGGCCGTG 
TGGACCGAGG CCTCGCGTCG CGGGCACGGC CTCGGCCAGG TGGTCCGGTG GATGGCCGCC 
AACCCCGCGG CGCTGGCCGG CCTGGACGGC AAGGGCGCCA TCGCCGTGGG CAAGGACGCC 
GACCTGGTCG CCTTCGACCC CGACGCCGGC CACACCGTGG ACGCGGCCGC CCTGCACCAC 
AGGAACCCGG TCACGCCCTA CCACGGCAGG ACGCTGCGCG GCGTGGTCCG CGCGACCTGG 
CTGCGCGGCC GGGCCGTGGG CGACCCCCCC GGCGGAGAGC TCCTGCGCCC CTCCCCGGCC 
GGAGCGCGCC ACCCGGGATC GGAACGCACC ACGGAAGAAA GGCCCTCACC GTGA

Protein sequence

MRAEDVTDLV IRSRRAVLPE GEGPAAVAVR RGRIAGLHAY DAVLEAAEQV DLGDTALLPG 
LVDTHVHVNE PGRTHWEGFA SATRAAAAGG VTTIVDMPLN SLPPTVDVGA LAGKRRAAAG 
QCLVDVGFWG GAVPGNVKDL RPLHEAGVHG FKCFLSPSGV EEFPPLDVDG LRAAMVEIAS 
FDGLLIVHAE DPGLLAEPAG PGYEEFLDSR PGRSERRAVE LVVALAGETG VRAHILHVSS 
ALCLEPLARA RREGVRITAE TCPHYLTLTA EEVPRGATEF KCCPPIRTSA NRERLWRGLA 
DGVLSCVVSD HSPSTPDLKV PDFAAAWGGI SSLQLGLAAV WTEASRRGHG LGQVVRWMAA 
NPAALAGLDG KGAIAVGKDA DLVAFDPDAG HTVDAAALHH RNPVTPYHGR TLRGVVRATW 
LRGRAVGDPP GGELLRPSPA GARHPGSERT TEERPSP