Gene Sros_8566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8566
Symbol
ID	8671900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	9451403
End bp	9452773
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	69%
IMG OID
Product	cystathionine beta-synthase
Protein accession	YP_003343951
Protein GI	271969755
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCGTAC ATGATTCACT CGTGGAGCTG ATAGGCAACA CTCCACTCGT CCGGCTGCAC 
AAGGTGACGG CGGGGCTGCC GGCTCAAGTG CTGGCCAAGG TGGAGTATTT CAACCCGGGC 
GGCTCGGTGA AAGACCGGAT CGCGGTGCGG ATGATCGATG CCGCCGAGAA GTCGGGCGCG 
CTGCGCCCCG GCGGCACGAT CGTGGAGCCC ACGTCGGGCA ACACCGGGGT CGGGCTGGCC 
ATCGTGGCCC AGCAGCGGGG CTACAAGTGC CTGTTCGTGG TGCCCGACAA GGTCGCCCAG 
GACAAGATCG CGGTCTTGCG CGCCTACGGT GCGGAGGTCG TGGTCTGCCC GACGGCGGTC 
TCTCCCGACC ACCCGAGTTC CTACTACTCC GTCTCCGACC GGCTGGCCCG GGAGACTCCG 
AACGCCTGGA AGCCGGACCA GTACTCCAAC CCGAACAACC CCGACAGCCA CTACCACTCC 
ACCGGCCCGG AGATCTGGGA GCAGACCGAG GGCCGGCTCA CCCACTTCGT GGCGGGCGTC 
GGCACGGGCG GCACCATCAG CGGTATCGGT CGCTACCTCA AGGAGGTCTC CGACGGCCGG 
GTGAAGATCA TCGGAGCGGA CCCGGAGGGC TCGGTCTACT CCGGCGGCAG CGGACGGCCC 
TACCTGGTGG AGGGCGTCGG CGAGGACATC TGGCCGGCCA CCTACGACAC CACGATCTGC 
GACGAGATCA TCGCCGTCTC CGACAAGGAC TCCTTCGGCA TGACCCGTCG CCTGGCCCGC 
GAGGAGGCGC TGCTGGTGGG CGGCTCCTGC GGCATGGCGG CGGTCGCGGC ACTGCGCGTG 
GCCAAGCAGG CCGGCCCGGA CGACGTGGTC GTGGTGCTGC TGCCCGACGG CGGCCGGGGC 
TACCTGTCGA AGATCTTCAA CGACGACTGG ATGGCCGACT ACGGCTTCCT GACCACCTCC 
AGCGACGAGG GCCTGGTCAA GGACGTGCTG ACCCGCAAGG GATCCGGCAT GCCGGAGTTC 
GTGCACACCC ACCCGCACGA GTCGGTGGAC ACGGCCATCT CCATCATGCG GGAGTACGGC 
GTCTCGCAGC TCCCGGTGAT GAAGGAGGAG CCGCCGGTCA TGGCCGCCGA GGTGGTCGGC 
TCGATCCTGG AGCGCGACCT GCTCGACGCC CTCTACCGCG GCCGGGTGCG GCCGAACGAC 
CCGCTGGCCG ACCACATGTC CCAGCCGCTG CCTATGATCG GTGCGGGGGA GCCGGTCTCC 
ATCGCGGTCG AGGCGCTGGA GAAGGCCGAC GCCGCGGTCG TCCTCGACGA CGGCAAACCC 
GTCGGACTGG TCACCCGTCA GGACCTGCTG GCCTTCCTCG CCAACCACTA G

Protein sequence

MRVHDSLVEL IGNTPLVRLH KVTAGLPAQV LAKVEYFNPG GSVKDRIAVR MIDAAEKSGA 
LRPGGTIVEP TSGNTGVGLA IVAQQRGYKC LFVVPDKVAQ DKIAVLRAYG AEVVVCPTAV 
SPDHPSSYYS VSDRLARETP NAWKPDQYSN PNNPDSHYHS TGPEIWEQTE GRLTHFVAGV 
GTGGTISGIG RYLKEVSDGR VKIIGADPEG SVYSGGSGRP YLVEGVGEDI WPATYDTTIC 
DEIIAVSDKD SFGMTRRLAR EEALLVGGSC GMAAVAALRV AKQAGPDDVV VVLLPDGGRG 
YLSKIFNDDW MADYGFLTTS SDEGLVKDVL TRKGSGMPEF VHTHPHESVD TAISIMREYG 
VSQLPVMKEE PPVMAAEVVG SILERDLLDA LYRGRVRPND PLADHMSQPL PMIGAGEPVS 
IAVEALEKAD AAVVLDDGKP VGLVTRQDLL AFLANH