Gene Sros_0035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_0035
Symbol
ID	8663298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	39788
End bp	40996
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	69%
IMG OID
Product	hypothetical protein
Protein accession	YP_003335838
Protein GI	271961642
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAAC CCCTCTCCGC CACGGCACCC ACACATGTGA CCACTCGATC GCTGGCACCG 
GATCTGGCGC GCGGCTTCAT GCTGCTGCTG ATCGCCCTGG CGCACGCGCC GGCGTTCGTC 
GGCGACTGGG ACGCCGGGCC CGCCGCGCTC AACACCGCCG CGAAGTTCGT CAAGTCCCTG 
TTCGCCGACA ACCAGGCCCG CAGCATGTTC GTGCTGCTGT TCGGCTACGG TCTCGGCCAG 
CTGGCCCATC GCCAGCACGC CCGGGGCGAC GACTGGACCT CGGTCCGGAA ACTGCTGCGG 
CGCAGGGCCT TCTGGCTGAT CGTCATCGGC TTCGCGAACA CGGTACTGCT CGTGCCGATC 
GACATCATCG CGGTGTACGG ACTGACGCTG CTGGTGCTCG CACCGCTCGT GCGAGCGCGG 
GATTCGGTGC TGTGGTGGAC GAGCATCCTG ACGCTCATCC CCGCGACCCT CCTGCTGGCC 
TGGCAGAGCG TGGCCGCCCA GGCGGGCCCC GTCACCATGG CGGAGTTCAT GGAGCCCACC 
TTCGGCGCCC ACCTCGTCGC GAGCATTCCC TCCTGGCCGG TGGAGACCGC CATCTCCACG 
ATCATCGTGG TGCCGGGCAT GCTGGTGGGA ATCTGGGCCG CCAGGCGCCG GATCCTCGAC 
GAGCCCGAGC GCCATGCGTC GTTGCTGCGC CGCATCACTG TGATCTTCAT CGGGGTGTCC 
GTCATCGGCA GGCTTCCCGC CGCTCTGCTG GCGGCCGGCG CGTGGACGAC CACCTCGGCC 
CCGATCGGCT GGACGATTGC CATCGCGCAC GACCTGACCG GATACGCGGG CGGCATCGGC 
ATGGCCGCCG CCGCCGGACT CGTCGCGATC AGGGTACGGC GTGGCCGTCT GATCACGGCC 
CTGGCGGCGC TGGGGCAGCG CTCACTGACC TTCTACCTGC TCCAATCCGT GGTGTGGGTG 
GCGCTGTTCT ACCCGTTCAC CCTGGGCTTG CGGGACGACA TGAGTTTCGC CGCCACTTTC 
GGAATCGCCA TCGGACTCTG GGTGGCCTCT GTCCTGCTGG CCGAGTGGAT GCGCCGCGCG 
GGCTACCGCG GCCCGGCGGA AGTGCTGTTG CGGCGACTGT CATACCGCCG CCCCGCTCCG 
GCCTCCGTTT CCGATGAACC CCACGGCAGC CCCGCCCGGC AAGGCGAGAA CGCCGGACAC 
CGGCTGTGA

Protein sequence

MAKPLSATAP THVTTRSLAP DLARGFMLLL IALAHAPAFV GDWDAGPAAL NTAAKFVKSL 
FADNQARSMF VLLFGYGLGQ LAHRQHARGD DWTSVRKLLR RRAFWLIVIG FANTVLLVPI 
DIIAVYGLTL LVLAPLVRAR DSVLWWTSIL TLIPATLLLA WQSVAAQAGP VTMAEFMEPT 
FGAHLVASIP SWPVETAIST IIVVPGMLVG IWAARRRILD EPERHASLLR RITVIFIGVS 
VIGRLPAALL AAGAWTTTSA PIGWTIAIAH DLTGYAGGIG MAAAAGLVAI RVRRGRLITA 
LAALGQRSLT FYLLQSVVWV ALFYPFTLGL RDDMSFAATF GIAIGLWVAS VLLAEWMRRA 
GYRGPAEVLL RRLSYRRPAP ASVSDEPHGS PARQGENAGH RL