Gene Sros_3622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3622
Symbol
ID	8666910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4017557
End bp	4018948
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	73%
IMG OID
Product	TPR repeat-containing protein
Protein accession	YP_003339296
Protein GI	271965100
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAAGG ACGAGCACGG GCTGGCGATG AGCTCCGCGA GCGACGCCGC CGCCCGCCAC 
TACGACCGGG CCGTCCACGA ACTGCTGCAC TTCCGCGCGG AGGTGGACGC CGAGGCGGAG 
GCGGCGCTGG CGGAGGACCC CGGCTTCCCG ATGGGCAACG TCCTGGCCGC CTACCTCGGC 
CTGCTGACCA CCGAGCCCGC GGATGCGCGG CGCGCGCGAG AGAGGTTCGC GCGGTTCCGC 
TCCGGCGTCG ACGTGACGGC CCTGCCGTCC CGCGAGCAAG CGCACGTGCA TGCCGTACAG 
GCGCTCCTGG ACGGCGACCT CCTCACCTGC GGGACCCTGC TGGGACGGAT CACCGAGGAG 
CATCCGAGGG ACGCGCTGGC GCTGATCGCC GGGCACCAGA TCGACTTCCT CACCGGCGAC 
GCGCGGGCGC TGCGGGACCG GGTCGGGGGC GCGCTGTCGG CCTGGGGCGA GGACGACAGG 
CACTACGGCC ACCTCCTCGG GATGTACGCC TTCGGGCTGG AGGAGGCGGG CCACTACGAC 
AGGTCCGAGG AGGTGGGCCT GCGCGCGGTG GAGCTCAACC CCAAGGACGT GTGGGGCGTC 
CACGCCGTCG CGCACACCTA CGAGATGCAG GGCCGCTTCG GCGAGGGCGT CCGCTACCTC 
GACGACAGGC TGGCCGACTG GTCCACCGGC ACGTTCTTCA ACGTGCACAC CTGGTGGCAC 
TACTCCCTCT ACGCCCTGGA GGCGGGCGCG ACCGGACGGG TGCTCGACAT CTACGACTCC 
GTCCTGGCGG GCGGGGAGAC CGCGATGGAG ATGCTCGACG CCGCGGCCCT GCTCTGGCGC 
CTCCACCTGG AGGGCGGCGA CCAGACGGAG CGGTGGAAGG TGCTCTCCGA CACCTGGGTG 
CCCAGGATGG AGGAGCCGTT CTACGCCTTC AACGACATGC ACGCCGTCAT GTCCTACGTG 
GGCGCGGGCC GGATCGCCGA GGCCGAGAGG CTGATCGCCG GCCGCGAGGA CTACGTGGCG 
GGCGAGCACG CCACGACCAA CCACGCGATG ACCGCCCGGG TCGGCCTGCC CGTCTGCCGG 
GCCCTCGTCG CGTTCGGACG GCGCGACTAC GGCGGGGTCG TCGACCTGCT CCACCCGATC 
AGGCACCGGA TCAACGAGTT CGGCGGCAGC CACGCCCAGC GCGACGCGGT CCACAAGACC 
CTCGTCGAGG CCGCGATCCG GGCGGGACGG AGCGAGGCCC GGGTGCTGGT GAGCGAGCGG 
ATCAGCATCC GGCCGCGCAG CCCGTTCAAC TGGCTCAAGC AGAGCGCGGT GGCCGACGAC 
CTCGGCGCGC GGGCCGCCGC CCGGGCACGG GCCGAGGAGC TGGTACGGCA GGCGGCCCTC 
CCGTTCCGGT GA

Protein sequence

MHKDEHGLAM SSASDAAARH YDRAVHELLH FRAEVDAEAE AALAEDPGFP MGNVLAAYLG 
LLTTEPADAR RARERFARFR SGVDVTALPS REQAHVHAVQ ALLDGDLLTC GTLLGRITEE 
HPRDALALIA GHQIDFLTGD ARALRDRVGG ALSAWGEDDR HYGHLLGMYA FGLEEAGHYD 
RSEEVGLRAV ELNPKDVWGV HAVAHTYEMQ GRFGEGVRYL DDRLADWSTG TFFNVHTWWH 
YSLYALEAGA TGRVLDIYDS VLAGGETAME MLDAAALLWR LHLEGGDQTE RWKVLSDTWV 
PRMEEPFYAF NDMHAVMSYV GAGRIAEAER LIAGREDYVA GEHATTNHAM TARVGLPVCR 
ALVAFGRRDY GGVVDLLHPI RHRINEFGGS HAQRDAVHKT LVEAAIRAGR SEARVLVSER 
ISIRPRSPFN WLKQSAVADD LGARAAARAR AEELVRQAAL PFR