Gene Sros_7839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_7839
Symbol
ID	8671162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	8646928
End bp	8648298
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	66%
IMG OID
Product	hypothetical protein
Protein accession	YP_003343245
Protein GI	271969049
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.916683
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGTTC TCGTGACGGT GGACGGCGAC GACGACGAGC TCTCCCGCCG TCTGCTGGAG 
GATCTGCGCA GGACTGCCGC GCATGAGACC AGGCTTCTGT CACGGATCGG CACCGCTGAC 
GGACAGGGCC ACCCCGACTC CATCGACCGT GCACGTGAGT CGCTGCTCTT CTCCTTCGAT 
CCGGCCGACA TCCCCGCATT CGCTCATGCG ATAGTCGTCT GGCTGCGCCA TCGGACCAAA 
TTCGGTTTTT CACAGCCGGA ACACGGCATG GTCGTAAGCA TTTCCGCCGG GGGGCAGGAG 
CTCAAGCTCT CCAGCACCGA GACGGTTTCA ATCTCCGAAC AGGCCCGGCG CATCGGTCAG 
CACCTCCGGA CAGGGCAGGA AGGCGGACCG GAAGCTCTCT TCGAGGACCG GAAGAACCAA 
ATACTCCAGC GGTATCGGGA GGACCGATCC CTACGGAAGC AGGAGTTGAA GCGCTACCTG 
CTTCGGGCAC AGCAGCGGCA TGAGCTGGAG CGTGAGAGGG CGATCCAGGA GCAGCGGCAG 
CGTGCGACAG AGCATGAGCG TGAGAGCGCC ATCCAGGAGC AGTGGCAGCG TACGGCAGAG 
CATAAGCGTG AGCGAGAGCG CGCTGATCTG AGCGCCCGGA TGGAATTGTT CCGCCTCCTC 
GCGGAGCGGG GACACCTGGA CAGCCCCCTC ACCGGAGCGG CCGAGGACAT GCTCGCCGCC 
ATCGGGAAAG GCGCCCGCGC GGAGGATTCC CTCCGGGAAG CACTGCGCAC GCAGGCCGAG 
GCCATGGACG CGACTGCGGG TGTGGAACCG CAGAGGCAGG CCTGCGCTGT TCATGTGAGC 
GAGACCCAGG CGGGCCCGGC GGTGCGGGAC GCGCTCGTCG ACCTGGCCGC CGCGTTCGGA 
TGGACGGTCG AACCCGACTC CAGGCCGATC ATCGGATCCT TCTTCCAGCG GCTGACGATG 
TGGACCAAAG ATGTGGCGAC CTCGGCAACC GCCAAGGAGA TCGCCGAGGA GGTCCGCCGT 
GGCATCGAGC TGGCCACCAT CCACAGCCAG CAGGCCGACA ACGACAACCG GCAGGCGGAG 
GCCGTCGCCA AACTGGTGCA GTCGCTGGAG GGAACCGACA AGGCGGTGAT GCTCGTGGGC 
TCCATCCTGA TCATGAAGGA TGACGGCCGG CTCTCGGTCA GGACGCTGAC CCAGCGACAG 
CTCATGTTCC TCGACCGTCA TGCCACCAGC GTCACCGACC CTGCCGCGGT CCTCCAGGCG 
CTGGACGAGT GCGCGCGATC CCACCACGCG GAGGCGCTGG AGCCTCCTAC CATCGCGGCG 
TTTCGCGCGA TCGAAACCCG TCCGGACGAC GATCTGTCCG CGACACCGTG A

Protein sequence

MDVLVTVDGD DDELSRRLLE DLRRTAAHET RLLSRIGTAD GQGHPDSIDR ARESLLFSFD 
PADIPAFAHA IVVWLRHRTK FGFSQPEHGM VVSISAGGQE LKLSSTETVS ISEQARRIGQ 
HLRTGQEGGP EALFEDRKNQ ILQRYREDRS LRKQELKRYL LRAQQRHELE RERAIQEQRQ 
RATEHERESA IQEQWQRTAE HKRERERADL SARMELFRLL AERGHLDSPL TGAAEDMLAA 
IGKGARAEDS LREALRTQAE AMDATAGVEP QRQACAVHVS ETQAGPAVRD ALVDLAAAFG 
WTVEPDSRPI IGSFFQRLTM WTKDVATSAT AKEIAEEVRR GIELATIHSQ QADNDNRQAE 
AVAKLVQSLE GTDKAVMLVG SILIMKDDGR LSVRTLTQRQ LMFLDRHATS VTDPAAVLQA 
LDECARSHHA EALEPPTIAA FRAIETRPDD DLSATP