Gene Sros_2485 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2485
Symbol
ID	8665771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	2709961
End bp	2711307
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	71%
IMG OID
Product	alpha-N-arabinofuranosidase
Protein accession	YP_003338204
Protein GI	271964008
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0107043
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCGACCA CCGCCCGTCT CACGCTGGAC CCCGCCTTCC GGATCGGCCC GGTGGACCCC 
CGGCTCTTCG GCTCGTTCGT CGAGCACATG GGCCGCTGCG TCTACACCGG CGTCTTCGAG 
CCCGGCCATC CCCTGGCCGA CGCCGACGGT TTCCGCACCG ACGTACTGGA GCTGACCCGC 
GAGCTCGGGG TGACGCTGGT CCGTTACCCC GGAGGCAACT TCGTCTCCAA CTACCGCTGG 
GAGGACGGCG TCGGCCCGGT GGAGGACCGG CCGGCCCGGC TGGAACTGGC CTGGCGGAGC 
CTGGAGGGCA ACAGCTTCGG GCTCAACGAG TTCATGGCCT GGGCCGCCAA GGCCGGGGTG 
GAGCCGATGA TGGCGCTCAA CCTGGGCACC CGCGGCGTGG CCGAGGCGCT GGAGCTGGTG 
GAGTACGCCA ACTATCCCGG GGGCACGCGC CTGTCCGAGC TGCGCCGCGC GCACGGCGCC 
GACAAGCCGC ACGACGTGCG GCTGTGGTGC CTGGGCAACG AGCTGGACGG CCCCTGGCAG 
ATGGGCCACA AGACCGCCGG GGAGTACGGC CGGCTCGCCG CCGAGACGGC GCGGGCGCTC 
AAACGCTTCG ACCAGGGGCT GTCCCTGGTG GCCTGCGGCA GTTCCAACAG CGGCATGCCG 
ACGTTCGGCG CGTGGGAGGC GGAGGTCCTG GAGGCGACCT ACGAGATGGT CGACTACGTC 
TCGCTGCACG CCTACTACGA TCCGTCCGAC GGTGACGTCG ACTCCTTCCT GGCCAGCGGC 
GCCGACATGG AGCACATGAT CCGTTCGATC GCCGCCACCG CCGACCACGT GGGCGCGAAG 
CTGCGCAGCG ACAAGAAGAT CAAGCTCTCC TTCGACGAGT GGAACGTCTG GTACCAGAGC 
CGTTTCAACG GAGAGTCCTC GCTGGAGTGG ACCGAGCACC CCCGGCTGAT CGAGGACTCC 
TACGACGTCA CCGACGCGGT GGTGGTCGGC AGCCTGCTCA TCACCCTGCT GCGCAACGCC 
GACCGGGTCG GCGTCGCCTG CCAGGCGCAG CTGGCCAACG TGATCGCCCC GATCAGGACG 
GAGCCCGGCG GCCCCGCCTG GCGGCAGACC ATCTTCCATC CGTTCGCGCT GACCGCCAGG 
CACGCCCGCG GCGAGGTGCT CCGGGTGGAG CCCGAGTGCG CCACGATCCC CACCGCCAAG 
TACGGCGAGG CCCCCGCGAT CTGGGCGACC GCCACCCACG ACGCGGCGAC CGGCGCGGTG 
ATCGCCAGTC TGCCGGTGAT CGTGCTCTAC CTCGTCGCCC AGCGCTGGGT GATCGAGGGA 
ATCTCCCGCT CGGGGCTCAA GGGATGA

Protein sequence

MATTARLTLD PAFRIGPVDP RLFGSFVEHM GRCVYTGVFE PGHPLADADG FRTDVLELTR 
ELGVTLVRYP GGNFVSNYRW EDGVGPVEDR PARLELAWRS LEGNSFGLNE FMAWAAKAGV 
EPMMALNLGT RGVAEALELV EYANYPGGTR LSELRRAHGA DKPHDVRLWC LGNELDGPWQ 
MGHKTAGEYG RLAAETARAL KRFDQGLSLV ACGSSNSGMP TFGAWEAEVL EATYEMVDYV 
SLHAYYDPSD GDVDSFLASG ADMEHMIRSI AATADHVGAK LRSDKKIKLS FDEWNVWYQS 
RFNGESSLEW TEHPRLIEDS YDVTDAVVVG SLLITLLRNA DRVGVACQAQ LANVIAPIRT 
EPGGPAWRQT IFHPFALTAR HARGEVLRVE PECATIPTAK YGEAPAIWAT ATHDAATGAV 
IASLPVIVLY LVAQRWVIEG ISRSGLKG