Gene Sros_5131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5131
Symbol
ID	8668425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5644375
End bp	5645571
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	73%
IMG OID
Product	putative dehydrogenase
Protein accession	YP_003340656
Protein GI	271966460
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.143413
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCACC GCATCATCGT CCTCGGAGCC GGATACACCG GAGCCATCGC CGCCGGCCGC 
CTTGCCAAGC GGCTCCGCCG CGAGGACGTC GCCATCACCC TCGTCAACGC CGAGCCCGAC 
TTCGTCGAAC GCGTCCGCAT GCACCAGCTG GCGACCGGCC AGGACCTCAA GCCCCGGTCG 
TTCGGCGAGA TGTTCGCGGG CACCGGCGTC GAACTGAGGA TCGCGAAGGT CACCGGCGTC 
GACGTCGACC GCAGGACCGT CGCCGTGATC GACGCGAACG GTGCCGAAGA ACTCGCCTAC 
GACATGCTCG TCTACGCTCT CGGCAGCGGC TGGAACGCCC AAGGCGTCCC CGGGACCGCA 
GAGCACGCCT ATGAGATCGC CGGCCGCCCC GGAGCACTCC GGCTGCGCGA GCGCCTGGCC 
CGCCTCGACG CCGGGCAGAG CGTGGTCGTC GTCGGCGGCG GCCTCACCGG CCTGGAGGCC 
GCGACCGAGA TCGCCGAGGC CCGCCCGGAC CTCGACGTCG CCCTCGCCGC CCGCGGCGGC 
CTCGGCGACT GGCTCTCGCC CAAGGGCCGC GGGCACCTGC GGAAGGTCTT CGGCAAGCTC 
GGGATCACCG TGCACGAGCA CGCCACCGTC ACCGGCGTCG AAGCCGGCCG CGTCGCCACC 
GCCGACGGCA AGGCCATCCC GGCCGCGGTC ACCGTGTGGA CCACCGGCTT CGCGGTTCAC 
CCGATCGCGA AGGCGACCAC CCTGGAGGTC GCCGGCACCG GCCAGATCGT GGTCGACGGG 
ACCATGCGCT CGGTCTCGCA CCCGGACGTG TACGCCATCG GCGACGCGGC CATGGTGATG 
GGTCCCGGAG ACAAGCCGCT GCGGATGTCG TGCGCCTCGG GGACTCCGGC CGCGTGGCAG 
GCCGCCGACG CGATCGCGGC GCGCCTGACC GGCGGGAAGG TCCCGAACAC GCCGATCCGC 
TACTTCAACC AGTGCATCTC ACTGGGCCGC AAGGAGGGTT TGATCCAGTA CGTCACCGCC 
GACGACCGCG CCGTGCAGGC GGTCCTGACC GGACGGCTCG CCGCCGTCTA CAAGGAGCTG 
ATCTGCAAGG GTGCCGCCTG GGGCGTCGCC AACCCGACGC TCGGGCTGCC GACCCGGCGC 
CGCCGCGTCA CGCGGGAGCG GGCCGCTGTG GGCTCGGCCG GCAAGGCACT GGCATAG

Protein sequence

MQHRIIVLGA GYTGAIAAGR LAKRLRREDV AITLVNAEPD FVERVRMHQL ATGQDLKPRS 
FGEMFAGTGV ELRIAKVTGV DVDRRTVAVI DANGAEELAY DMLVYALGSG WNAQGVPGTA 
EHAYEIAGRP GALRLRERLA RLDAGQSVVV VGGGLTGLEA ATEIAEARPD LDVALAARGG 
LGDWLSPKGR GHLRKVFGKL GITVHEHATV TGVEAGRVAT ADGKAIPAAV TVWTTGFAVH 
PIAKATTLEV AGTGQIVVDG TMRSVSHPDV YAIGDAAMVM GPGDKPLRMS CASGTPAAWQ 
AADAIAARLT GGKVPNTPIR YFNQCISLGR KEGLIQYVTA DDRAVQAVLT GRLAAVYKEL 
ICKGAAWGVA NPTLGLPTRR RRVTRERAAV GSAGKALA