Gene Sros_0531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_0531
Symbol
ID	8663800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	537091
End bp	538221
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	71%
IMG OID
Product	hypothetical protein
Protein accession	YP_003336298
Protein GI	271962102
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGAGA TCACCCTGCT GGGGGCCGCC CTGCCGGACG CCCCGCCACC CACACCCGAG 
GCCGTCGCCC GCGCCCGCGC CCGCCTGACC GCCCACGGGG TACGGCGCCG CCGTCACCCC 
ACCTGGACAC TGATCATTGG AGCCTCCATG GCCACCGCCG CCGTCATCAC CGCAGTCGCG 
CTGGCCGCGA CCCTCCTGGC CCCGGCGCCG CCCTCGGTGC TGGAGACACC GAAGACCGGT 
GAGCACCTGC TCCGGGAACT CGCGGACAGG GTGGAGAAGC TCTCACCCGG GACCGGCGCC 
TACTGGCGCG TCCAGGGGAC TCGCGTCAAC CGGTATGCGG TCGGCACCGG ACCCACGCGC 
TACTGGATCG CGTCCAGAGG GGAGGTGCGC CAGTGGACAC CGCGGAAGCC GGGAGCCTTG 
TACGTCCAGG AGACCGAGTT GTCCGGCATC CGGCCGGACA CACCGCGGGA CGAGAAGATC 
TGGCGGAAGC AGGGCTCGCC CGACCGCTGG CGCCTGCCCA AGTGCGAGAG CTCCTCCCCT 
CCCTGCGCTC CGACCGCCCT CGCCGACAAG CGGTCGCGAC GCGAGTACCG GATCATGGGA 
GACGTCCCCG ACCCCGGCCT GGGAGGTCTC ACCATCGCCG AGTTGGACGC CCTCCCGACC 
GATCCGGCGC GGCTGCGGGA GCGCCTTGAG GGCTACCGCA AGGCCGAGCA GAAGCGGGGC 
CTCAAACGGT CCTGGGAGGA GTTCCTCAAG GCGGCCGTGC GCGATATGAC GGTCACGCCG 
GTCAGTCCCG GACTCCGGGC GGCGCTGCTG CGCCTGTACG TGGAACAGCC CGGGGCCGAG 
GTGGCGCGGG AGGACAGCGA TCCGCTGGGC CGTCCCGCCA TCGCCATCGA CCTCGAGACC 
AAGGGCTACT TCCAGCTGGG CACCCGTATG GTGCCGATCA CGAAAGAGAT CCTCCTCGAC 
CCTCGGACCG GTGAGGGCAT GGCCGAGAGG TCTGTCACGA CGGACGCCGA AGGCGGGTTC 
CCGAAGGGCA CCGTGGCCCA CTACGTGGTC GTCGAGAAGA TGGGCTGGAC CGATGAGCGG 
CCCAAGCTTC CCTCGGGCTG CCGGCTGAAG GCCGGCGTCA CCTGCCGCTG A

Protein sequence

MDEITLLGAA LPDAPPPTPE AVARARARLT AHGVRRRRHP TWTLIIGASM ATAAVITAVA 
LAATLLAPAP PSVLETPKTG EHLLRELADR VEKLSPGTGA YWRVQGTRVN RYAVGTGPTR 
YWIASRGEVR QWTPRKPGAL YVQETELSGI RPDTPRDEKI WRKQGSPDRW RLPKCESSSP 
PCAPTALADK RSRREYRIMG DVPDPGLGGL TIAELDALPT DPARLRERLE GYRKAEQKRG 
LKRSWEEFLK AAVRDMTVTP VSPGLRAALL RLYVEQPGAE VAREDSDPLG RPAIAIDLET 
KGYFQLGTRM VPITKEILLD PRTGEGMAER SVTTDAEGGF PKGTVAHYVV VEKMGWTDER 
PKLPSGCRLK AGVTCR