Gene Sros_4175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4175
Symbol
ID	8667469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4647976
End bp	4649196
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	68%
IMG OID
Product	hypothetical protein
Protein accession	YP_003339822
Protein GI	271965626
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.33945
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTGTTCG TCGGTGATGA CTGGGCTGAA GACCATCACG ATGTCGAGGT CCAAGACGAG 
GACGGCAAGG TGGTCAAGCG GGTCCGGCTG CCCGAGGGGA TGGCCGGGAT CACCCGGCTG 
CACGACCTGG TCGGCCGGTT CGTGGCCGAG GACGCCGACC CGTCCGACGT GCTCGTCTGC 
ATCGAGGTCG ATCGGGGCCC GTGGGTGCGG GCGCTGGTGG CCGCGGGCTA TCGGGTGTTC 
GGCGTCGATC CCAAGCAGGC CGCCCGGCAC CGGGAGATCC TCGGCAGCTC GGGGGCCAAG 
AGCGACAAGG GCGACGCCCA CGCCCTGGCC GACATGATCC GCACCCGCCG CAACCAGCTG 
CGCCAGGTCG CCGGGGACTC GGAGATCGCA GAGGCCGTCA AGGTCGTCAC CCGGGCGCAT 
CAGACGTTGC TGTGGGAACG CACCCGGCAC ATGCTGCGCC TTCGGGTGGC GTTGCGGGAC 
TACTTCCCCG CCGCCCTTGC CGCCTACAAG CCGCTCGGCC TCACCTCGGA GGCGGTGCTG 
AGGCTGCTGG CCAAGGCCCC CACCCCCGAG ACGGCGGCCA AGCTGACGAT CAACCAGATC 
AGCGCGACGC TCAAGGGCCG CCGCGACATC GGCGCCAAAG CCGCGGCGAT CCAGGACGTG 
CTGCGGGGCG AGCACCTCGG CCAGGCCCCG CTCGTCACAG GTGCCTACGC CTCCACCGTG 
AAGGCCCTGG CCGCCGTCAT CACCGTCCTG AACAGCGAGA TCAAGACGCT TGAGGGTGAG 
GTCGAGGCTC ATTTTGGCCG GCACCCGGAC GCTGAGGTCA TCCTCAGTCA GCCGGGCATC 
GGCGTCGTCC TCGGCGCCCG GGTGCTCGCC GAGTTCGGAG ACGCCGAAGG CCGCTACGTG 
AGCGCGAGGG CCCGCAAGAA CTACGCCGGA ACCTCGCCGA TCACCCGGCA GTTCGGCAAG 
ACCAAGATTG TCCAGGCCCG GTTCGTCCAC AACGACCGGC TCGTCGACGC TCTCCATCTC 
CAAGCCTCCT GCGCCCTCCT TCACGATCCT GAGGTCCGCG CTTACTACGA CCAGCTCAAA 
GCCCGTGACG TCAGCCATAA CGCCGCTCTC CGCCAAGTCG GCAACCGCCT GGTGGGCATC 
CTCCACGGCT GCCTCAAAAC CCACACCACC TACGACCAGG CAACCGCATG GTCACATCGC 
AACCACGACC TCGCCGCTTG A

Protein sequence

MLFVGDDWAE DHHDVEVQDE DGKVVKRVRL PEGMAGITRL HDLVGRFVAE DADPSDVLVC 
IEVDRGPWVR ALVAAGYRVF GVDPKQAARH REILGSSGAK SDKGDAHALA DMIRTRRNQL 
RQVAGDSEIA EAVKVVTRAH QTLLWERTRH MLRLRVALRD YFPAALAAYK PLGLTSEAVL 
RLLAKAPTPE TAAKLTINQI SATLKGRRDI GAKAAAIQDV LRGEHLGQAP LVTGAYASTV 
KALAAVITVL NSEIKTLEGE VEAHFGRHPD AEVILSQPGI GVVLGARVLA EFGDAEGRYV 
SARARKNYAG TSPITRQFGK TKIVQARFVH NDRLVDALHL QASCALLHDP EVRAYYDQLK 
ARDVSHNAAL RQVGNRLVGI LHGCLKTHTT YDQATAWSHR NHDLAA