Gene Sros_0639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_0639
Symbol
ID	8663908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	647308
End bp	648597
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	69%
IMG OID
Product	hypothetical protein
Protein accession	YP_003336405
Protein GI	271962209
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGATTG AGACCGTGGG GCGTGAGATG CACGCCCTGG TCGAGCGGCT CTACCCGCTG 
TGCCGGAGCA TCACCGGCGA CGGGGTGCGC CGCACTCTGG AGATCGTCGG GGAGTCCGTG 
CCCCTGCAGA TCCGTGAGGT GCCGACGGGG ACCGAGGTCC TCGACTGGAC GGTGCCCAGG 
GAGTGGAACA TCCGTGACGC CTACATCAAG GACGCCTCGG GCGCCCGGGT GGTCGACTTC 
GCGGAGTCCA ACCTCCACGT GGTCGGCTAC AGCGTCCCCG TGTCGGCCAC CATGTCCCTG 
GCGGAGCTCC GCGGCCACCT GCACACCCTG CCCGACCAGC CCGACCTGAT CCCCTACCGG 
ACCAGCTACT ACGCGGAGAC CTGGGGGTTC TGCCTGCGGG AGAGCACCCT GGCCGGCCTC 
CCGGAGGGCG ACTACGAGGT CCGGATCGAC TCGACCCTGG CCGACGGCCA CCTGACCTAC 
GGCGAGCACG TGGTGCCCGG CCGGGTCTCC GACGAGGTGC TCGTCTCCTG CCACGTGTGC 
CACCCCTCGC TGGCCAACGA CAACCTGGCG GGCATCGCCG TGGCGACCAG GCTCGCGCGG 
CGGCTGGCCG AGTCCGACCC GTGGTACACC TACCGCTTCC TGTTCATGCC CGGCACGATC 
GGCGCGATCA CCTGGCTGGC GCGTAATCAG GAGCGTGTCG GAAGGGTCAA GCACGGCCTC 
GTGCTGGCCT GCGCGGGAGA CAGCGGCGCG CTGACCTACA AGCGCAGCCG GCGCGGGGAC 
GCGGAGATCG ACCGGGTGGT GCGGCACGTC CTGCGGACCT CGGGGCGCGA CCACGAGATC 
GTGGACTTCT CCCCGTACGG CTACGACGAG CGCCAGTTCT GCTCGCCCGG ATTCGACATG 
CCGGTCGGCT CCCTGACCCG CACGCCGTAC GCCGGCTACC CGGAGTACCA CACCTCGGCG 
GACAACCCGG ACTTCGTCTC GCCCGAGGCG ATGACGGACA CCCTGGAGAC CTGCTGGGAG 
ATCACGCAGG TGCTGGAGCG CAACCACCGC TACCTCAACC TCAGCCCGTA CGGCGAGCCG 
CAGCTCGGCA GACGGGGCCT GTACGGCTCG CTGGGTGGAC GCAGCGACAC CAAGCAGGCG 
CAGATGGCGA TGTTGTGGGT GCTGAACCTC TCCGACGGAG AGCACAGCCT GCTGGACATC 
GCGGAACGGT CCGACCTGCC CTTCGCCACC GTGGCGGATG CGGCACAAGC CCTGCGTGGT 
GCGGGACTCG TCAAGGAGAA GGGGAAATGA

Protein sequence

MTIETVGREM HALVERLYPL CRSITGDGVR RTLEIVGESV PLQIREVPTG TEVLDWTVPR 
EWNIRDAYIK DASGARVVDF AESNLHVVGY SVPVSATMSL AELRGHLHTL PDQPDLIPYR 
TSYYAETWGF CLRESTLAGL PEGDYEVRID STLADGHLTY GEHVVPGRVS DEVLVSCHVC 
HPSLANDNLA GIAVATRLAR RLAESDPWYT YRFLFMPGTI GAITWLARNQ ERVGRVKHGL 
VLACAGDSGA LTYKRSRRGD AEIDRVVRHV LRTSGRDHEI VDFSPYGYDE RQFCSPGFDM 
PVGSLTRTPY AGYPEYHTSA DNPDFVSPEA MTDTLETCWE ITQVLERNHR YLNLSPYGEP 
QLGRRGLYGS LGGRSDTKQA QMAMLWVLNL SDGEHSLLDI AERSDLPFAT VADAAQALRG 
AGLVKEKGK