Gene Sros_4857 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4857
Symbol
ID	8668151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5380563
End bp	5381783
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	71%
IMG OID
Product	Allantoicase
Protein accession	YP_003340418
Protein GI	271966222
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.152506
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACCC ACGGTTTCAC CCGGCTTCCG GACCTGGCCT CACGCGCGCT GGCCGGTAGC 
GTGGTGTACG CCAACGACGA GCTGTTCGCC GAGCGCGAGA ACTTGATCAA GCCCGCGGCG 
GCGGTGTTCT CGACGGAGGA CTTCGGCCAC AAGGGCAAGG TGTACGACGG CTGGGAGACC 
CGCCGCCGGC GCGAGCCCGG CAACGACCAC GCGATCGTCC GACTCGGCGT CCCGGGCGTG 
GTGCACGGCG TGGTGATCGA CACCGCCTGG TTCAAGGGCA ACTATCCGCC CTATGCCTCG 
GTGGAGGCGA CCAGCGTCGA GGGGGCTCCG TCACCGGCCG AGCTGGAGCG GGCGAACTGG 
GAGACGATCG TCGGGAAGAG CGCGATCAAG GGCGACACCG AGAACGCGTT CGAGGTGGCG 
GACCGGCGGC GCTGGACGCA TGTCCGGCTG AGCATCTACC CCGACGGCGG GGTGGCCCGG 
TTCCGGGTGC ACGCCGAGCC GGTGCCGGAT CCTCGGTTCA TGGACGGCAC GATCGACCTG 
GCCGCGCTGG AGTACGGCGG CGCGGTGGTG GACTGCTCGA ACACGTTCTA CTCCTCGCCG 
GTGCAGCTGC TGCTGCCCGG CAGGGCCAGG ATCATGGGCG ACGGCTGGGA GAACGCCCGC 
CGCCGCGACG ACGGCAACGA CCACGTGACG ATCAGGCTGG CCGCCCGTGG CCGGATCCGC 
CGGGTCGAGA TCGACACGTC GTACTTCGTC GGCAACGCGG CCGGCTGGGC CTCGCTGCGC 
GGGACCGATG GCGATCATCT GGACGAGGAC GCGGAATGGT TCGACCTGGT CGCGAAGACG 
CGGTTGCAGC CGGACACCCG GCACTTCTTC CGCTCGGTGT CGGCCGCGCC GGTGACGCAC 
GTCCGGCTGG ACGTCTTCCC CGACGGAGGC CTGGCCAGGC TCCGGGTGCA CGGCGAGGTG 
GTCGCCGACG CCCACCGCGG GGCCGTGCTG CGCTGGCTCG ATCTGCTCCC CGCCGAACAC 
GCCGTTCAGG TTCTCGGCGG GGCCGGTGTT CTCCCGGAGA CGGCGGAGGA CCTCCTCCGC 
CGACGACCGT TCGCCGCCGG GGGCGTGCTG CCTGCGACGG TGCTCTCCAC CTTGTCGGGA 
GGACCTCATC CGGCAGGACT CACCGGCGTA CCCACCTCGG AGACCGGGGA ACCCTATGAG 
GAGGTGGCGG GGTCCACGTG A

Protein sequence

MITHGFTRLP DLASRALAGS VVYANDELFA ERENLIKPAA AVFSTEDFGH KGKVYDGWET 
RRRREPGNDH AIVRLGVPGV VHGVVIDTAW FKGNYPPYAS VEATSVEGAP SPAELERANW 
ETIVGKSAIK GDTENAFEVA DRRRWTHVRL SIYPDGGVAR FRVHAEPVPD PRFMDGTIDL 
AALEYGGAVV DCSNTFYSSP VQLLLPGRAR IMGDGWENAR RRDDGNDHVT IRLAARGRIR 
RVEIDTSYFV GNAAGWASLR GTDGDHLDED AEWFDLVAKT RLQPDTRHFF RSVSAAPVTH 
VRLDVFPDGG LARLRVHGEV VADAHRGAVL RWLDLLPAEH AVQVLGGAGV LPETAEDLLR 
RRPFAAGGVL PATVLSTLSG GPHPAGLTGV PTSETGEPYE EVAGST