Gene Sros_5044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5044
Symbol
ID	8668338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5566305
End bp	5567726
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	74%
IMG OID
Product	amidase
Protein accession	YP_003340578
Protein GI	271966382
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00761067
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0205889
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAAC TGCACCACAT ATCGGCGGCG GACGCGCTGC GCGCCTTCCG CTCCCGGCAG 
CTGTCGCCGG TCGAGCTGAC CGAGGCGGTG ATCGCCCGCG CCGAACGGAC CGAGCCGGTC 
GTCAACGCGC TGTGCCACCG CTTCTTCGAT GAGGCGCTGC GGCAGGCCAA GCGGGCCGAA 
CGCCGCTACG CAGGCCAGGA CGGGCCGCCG CGGCCGCTGG AGGGGCTGCC CACCGTCGTC 
AAGGAGGACG AACCGGTTAC GGGGCACCCC TGGACCCAGG GGTCGCTACG GTATCGCGAC 
GTCGTCGCCG GGCACACCTC GCTCTTCGTC CGGCGCCTCC TCGACGCCGG CGTGATCGTG 
CACGCCCGGA GCACGGCGTC GGAGTTCGCT TCCGCCGCGT TCACGCACTC GGCGCTCTGG 
GGCGTCACCC GCAACCCGTG GAACCCGGAG TTCTCCCCCG GCGGCTCGTC GGGCGGCTCG 
GGCGCGGCGC TCGCCGCCGG GTCGACGGTG CTGGCGACGG GATCGGACAC CGCGGGCTCG 
ATCCGGGTGC CCGCCTCGTT CAGCGGTGTG GTCGGGTTCA AGCCGCCGCA CGGCCGGGTA 
CCGGTGGACC CGCCCTATCA CCTCGACACC TACGTGCACT CCGGTGTGCT GGCCCGCACC 
GTCGCCGACG TCGCACTGAT GCAGAACGTC GTGGCCGGGC CCCACCCGGG GGACGTCGGC 
TCGCTGCGGC CCCGTCACGT CCTGCCGGAT CCCGCCGAGC TTGGCCGCGA CCTGCGCGGG 
ATGCGGATCG CCTTGTCCGA GGACCTCGGT GACTGGGCGG TCGACCCGGA GGTCCGCCGC 
AACACCCGGG AGTTCGGCGA GCGGCTGCGA GCGGCCGGGG CCCGCGTCGA GGAGGTCGCG 
CTCCCGGTGC CGCGGGCGCA GGTGCTGCGC GCGGCGGCCA TCCACTTCCA CCACGGATTC 
GGCGCCGCCG TCGCGGCCGA CGGGCGCAAG CCCGGCGCCC CTCTCACCCC GTATGCGCAG 
GCGTTCGCGC GGTGGGCGGC CGAGGGCGCC GCCGGCGCCG GCGTGCTCGA CGGATTCGCG 
ATCGAGTCCG ACCTTTACCG GCCCGTCGGC GAGCTGCTCG AGCGGTTTGA CGCGCTCGTC 
TGCCCGACCG CGGCCACCCG TGGACTGGTG GCGGGCGAGG ACTACCTCGA CCACGGCCCG 
GAGGTCGACG GCGAACGGCT CGGGCACTAC CTGGAGTCGC TGCTCGCGCT CCCGTTCAAC 
ATCATGAACC GCTGCCCCGT GCTGGCCGTG CCGTCCGGCG TCGCCGACAA CGGGGTGCCC 
ACCGGGGTGC AGATCGTCGG GCGGCCGTTC GACGACACCA CGCCGTTCCG TGTCGGGGCG 
GCGGTCGAGC AGCGGCCGCA CTGGCCGGAG GTCGGGACGT GA

Protein sequence

MDELHHISAA DALRAFRSRQ LSPVELTEAV IARAERTEPV VNALCHRFFD EALRQAKRAE 
RRYAGQDGPP RPLEGLPTVV KEDEPVTGHP WTQGSLRYRD VVAGHTSLFV RRLLDAGVIV 
HARSTASEFA SAAFTHSALW GVTRNPWNPE FSPGGSSGGS GAALAAGSTV LATGSDTAGS 
IRVPASFSGV VGFKPPHGRV PVDPPYHLDT YVHSGVLART VADVALMQNV VAGPHPGDVG 
SLRPRHVLPD PAELGRDLRG MRIALSEDLG DWAVDPEVRR NTREFGERLR AAGARVEEVA 
LPVPRAQVLR AAAIHFHHGF GAAVAADGRK PGAPLTPYAQ AFARWAAEGA AGAGVLDGFA 
IESDLYRPVG ELLERFDALV CPTAATRGLV AGEDYLDHGP EVDGERLGHY LESLLALPFN 
IMNRCPVLAV PSGVADNGVP TGVQIVGRPF DDTTPFRVGA AVEQRPHWPE VGT