Gene Sros_9220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_9220
Symbol
ID	8672567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	10166089
End bp	10167270
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	72%
IMG OID
Product	DNA-directed DNA polymerase
Protein accession	YP_003344581
Protein GI	271970385
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGAGTCT TCGATGACCT TGTGGGGCAG GAGCGGGCTG CGGTGGCGCT CCGCCGGGCC 
GCCGAAGGGG CCGCCGAGAT GCTGGCCGGA GGCTCCGGCG CGGGGATGAC CCACGCGTGG 
CTGTTCACCG GGCCGCCCGG GTCCGGCCGG GAGGAGGCGG CACGGGCGTT CGCGGCCGCG 
CTGTTCTGCC CCGACCAGGG GTGTGGCCAC TGCGACATGT GCCATCAGGT GGCGATCGGC 
TCCCACCCGG ACCTGGAGGT CGTCCGCACC GAGGGTCTCT CCTACGGCAT CAAGGAGACC 
CGTCAGCTCA TCCTCCGGGC GGCCGGGGCT CCGACGCTGG GGCGCTGGAG GGTCGTTCTG 
TTCGAGGGCG CCGACCGGAT GCCGGAGCGC GCCTCCAACG CGCTGCTGAA GGCGATCGAG 
GAGCCGCCGC CCAAGACGGT CTGGCTGCTC TGCACGCCCT CGCCCGCGGA CCTGGTCATC 
ACCATCCGGT CGCGCTGCCG GGTGGTCACC CTGGTCACCC CGCCCACGGC GGCGGTCGCC 
CACGCACTGG TGACCCGCGA CAACATTCCG CCGGACATGG CGGAGTTCGT CGCGCGGGCC 
ACCCAGGGGC ATCTGGCGCG GGCGCGGCGG CTGGCGCTGG ACCCGGAGAT GCGCGCGCGC 
CGCGAGGCCG TGCTCTCCAT CCCCCGCTCG CTCATCGGGG TCGGGGAGTG CGTCATCGCT 
GCGGAGCGGT TGGTGGACAC CGCCAAGAAG GAGGCCGACG CGGTCTCCTC GGCGTTGGAC 
GAGGGGGAGA CCGCCGAGCT CCGCAAGATC TACGGCGAGG GCTCCTCGGG GAAAGGGCTG 
AACAAGGGCC TGATCCGGGG TGGGGCAGGG GCGATCAAGG ATCTGGAGAA GCTCCAGAAG 
TCCCGGGCCA CCCGGACCCA GCGTGACGTC ATCGACGCGG CACTGCTCGA CCTGGTGGCG 
TTCTACCGCG ACGTGCTGGC CATGCAGTTC GGCGCGCACG TGGAGCTGGC CAACGAGGAC 
CGCCGGGCCG ACCTGGAAGG CCTGGCCCGT TCCTCCGGCC CGGAGGACAC GCTGCGCAGG 
ATCGACGCGA TCATGCGCTG CCGCGAGCGG CTGGCCGCCA ACGTCAACCC GCAGATGGCC 
GTCGAGGCGA TGACCATCTC GCTGCACCGG CCCCGACTCT GA

Protein sequence

MGVFDDLVGQ ERAAVALRRA AEGAAEMLAG GSGAGMTHAW LFTGPPGSGR EEAARAFAAA 
LFCPDQGCGH CDMCHQVAIG SHPDLEVVRT EGLSYGIKET RQLILRAAGA PTLGRWRVVL 
FEGADRMPER ASNALLKAIE EPPPKTVWLL CTPSPADLVI TIRSRCRVVT LVTPPTAAVA 
HALVTRDNIP PDMAEFVARA TQGHLARARR LALDPEMRAR REAVLSIPRS LIGVGECVIA 
AERLVDTAKK EADAVSSALD EGETAELRKI YGEGSSGKGL NKGLIRGGAG AIKDLEKLQK 
SRATRTQRDV IDAALLDLVA FYRDVLAMQF GAHVELANED RRADLEGLAR SSGPEDTLRR 
IDAIMRCRER LAANVNPQMA VEAMTISLHR PRL