Gene Sros_3568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3568
Symbol
ID	8666856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3954316
End bp	3956409
Gene Length	2094 bp
Protein Length	697 aa
Translation table	11
GC content	71%
IMG OID
Product	hypothetical protein
Protein accession	YP_003339245
Protein GI	271965049
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.44867
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCTCT CCCCCCTCGC GCAGCGCCTG CACAATTTGA TCACTGGGAC CGCGAATGAC 
CCCACGTACT GGCCCGAGGC CTCCCAGTTG AGCGCCGGGC TGGGCGCGGC GGTCCGGACC 
GTCGACGGCA GTTTGATATC GGCACCGTAC GTGGTCGACG AGCAGCGGCT GGCCGTGGCG 
GCCCGCGAGC TGGTCGGATA CCTGCTGGAC GAACACCGAC GGTACGAACC CTTCTCCGTG 
ATGGCGGCGG CGGGGCTGGC GGGCATGGAC GCCGAAGTGA GCGCCCAGTT CGCGGAGAAG 
CGCGGGCCGA TCGCGGTCGC CGAGATGGAG GTGGTGTTCG GCTGGGACGT GGAGCTGCGG 
GCGCTGCTCG CCGAGGCGAT GGCCAAGGCG ATGCGAGAAC GGCCAGACCA CGCCGCCCCG 
CTGCCCGCCG TCATCGAATG GCTCGGCGGC CGGCCCGGCT ACCTGGACTT CGCCCGGACG 
GTTCTGGAGG CGGCCGAGGC CCGCGTCACG GCGATCCACG CCGGCGAGAT TCCCTACAGC 
GCGGAGAAGG CGTTCGACGA CGGAGAGAAG AGGACCATCG GCCGGGCCGT ACGGCTGGCG 
CTCCTGCGGG ACGAGCCCTG GCTGCCCGAG CTGCTGGACA GGCTGCTGCG CGGGATCGCG 
GTGGCTCCGA CCCAGGCCAA GACCCTGCCG TCGCAGGGGC TGCTGTTCGA GATCGCCCGC 
GCGGTGGAAG AGCACCCGAC GCCCGAGGCG ATCTCCGCGC TGCGCGCCGC CCGCCAGGCC 
ACCCGGCACG CCGGGGTGCC CAAGCAACTG GACCGCATGT TCAAGCGCAT CGAGGCCGCC 
CTGGCCAACC GGCTGGAGGT GGCGTTCCGG ATACCCGACG GGCAGGTACG GCAGGCCGTC 
GGCGAGCACA CGGCGGTGAT CTCAACCGAC GGCAAGGTCG AGCTGTCGTG GTGGCACGGG 
GACAAGAAGC TGAAGACGGT CCCGGCGGCG GTCAGACGGG AGCACCCCGA GGAGGTCAAG 
CGGCTGCGCG AGCTGGCCAA GCAGACCGCG CAGCAGCAGG CCACCCTGAG CAGGGCGCTG 
GAAGCCGGAT GCGCCGGCGA GACGGCTCCG CCGTACCGGC AGCTGGAGGG CAACCCGGTC 
ACCGATCGGC TGATCTGGGA GTTCGAGGTC TCGCCGGGCG TGTGGCGCAG CGAGCTGGGC 
TTGACGGTGC CGGACGTGCC GGTGCGGCTG TGGCATCCGG CCCGCGCGTC CCTGGAGGAG 
GTGCGCGCCT GGCGGGAGGT GGTGCAGGGC AAGGAGCTGC GCCAGCCGTA CAAGCAGGCC 
TTCCGCGAGG TCTACCTGCT CACTCCCGCC GAGGAGGAGA CGCGCGACCA CTCGCGCCGG 
TTCTCCGACC ACCTGCTCCG GTACGGCCAG GCCAAGGCGC TGCTCACCGA TCGCGGCTGG 
ACCGGCATGA CGCTGGGCCA CTGGGACTGG TCCGGAGGGT CCGCTGAGTG CACGGCCACC 
AAAAAGCTGC CCGGCGGCCT GACCGTCACC TGGGACTTCC ACCTGGACGA GGGGTCCGCC 
GAGCGGGACA ACGTCGGCCC CGTCTCCATC TGCGTCAGCG GCGGCATCCG TTTCCTCGCC 
GGCGTCTCGC CGGTCCCGCT GGCCGAGGTT CCTCCGCTCA TCCTGTCGGA GGCGCTGCGA 
GACGCCGACC TGGTCGTCGG CGTCACCTCC ACCGGCCTGG ACCCCAATGG TCACGGGGAC 
TACTGGCAGT CCTACAGCTT CGGCGACCTG GCCGAGAGCG CCCAGGTCCG GCGCGACGCG 
CTCTCCCGGT TGATCGGGCG TACGGCCATC GCCGACCGGT GCGCCATGAC CGACCGCTTC 
CTGGTGGTCC GGGGTGATCT ACGCACCTAC AAGATCCACC TGGGGTCCGC GAACATCCTG 
ATGGAACCCA ACGACGCCTA CCTGTGCATC GTCTCCGCCC GCGACCGCCA CGCCGGACTG 
TTCCTTCCGT TCGAGGAGGA CGGCCGGTTG GCGCTCATCC TCAGCAAGGC TTTCCTGCTG 
GCGAACGACA CCGCCATCAC CGACCCCTCC ATCACCCGCC AGATCCGGGC TTGA

Protein sequence

MHLSPLAQRL HNLITGTAND PTYWPEASQL SAGLGAAVRT VDGSLISAPY VVDEQRLAVA 
ARELVGYLLD EHRRYEPFSV MAAAGLAGMD AEVSAQFAEK RGPIAVAEME VVFGWDVELR 
ALLAEAMAKA MRERPDHAAP LPAVIEWLGG RPGYLDFART VLEAAEARVT AIHAGEIPYS 
AEKAFDDGEK RTIGRAVRLA LLRDEPWLPE LLDRLLRGIA VAPTQAKTLP SQGLLFEIAR 
AVEEHPTPEA ISALRAARQA TRHAGVPKQL DRMFKRIEAA LANRLEVAFR IPDGQVRQAV 
GEHTAVISTD GKVELSWWHG DKKLKTVPAA VRREHPEEVK RLRELAKQTA QQQATLSRAL 
EAGCAGETAP PYRQLEGNPV TDRLIWEFEV SPGVWRSELG LTVPDVPVRL WHPARASLEE 
VRAWREVVQG KELRQPYKQA FREVYLLTPA EEETRDHSRR FSDHLLRYGQ AKALLTDRGW 
TGMTLGHWDW SGGSAECTAT KKLPGGLTVT WDFHLDEGSA ERDNVGPVSI CVSGGIRFLA 
GVSPVPLAEV PPLILSEALR DADLVVGVTS TGLDPNGHGD YWQSYSFGDL AESAQVRRDA 
LSRLIGRTAI ADRCAMTDRF LVVRGDLRTY KIHLGSANIL MEPNDAYLCI VSARDRHAGL 
FLPFEEDGRL ALILSKAFLL ANDTAITDPS ITRQIRA