Gene Sros_5820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5820
Symbol
ID	8669114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	6386518
End bp	6387861
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	67%
IMG OID
Product	ABC-type sugar transport system periplasmic component-like protein
Protein accession	YP_003341308
Protein GI	271967112
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.8778
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCACCGAC GCTTTCTCAT TCTCGCCACC GCCGCCCTCA CGGCCGGGGC ACTGACCGCC 
TGCACCGCGG GCAACCAGAG CGCACCCGCG CTCGGGGCGC AGCCCAAGCC CTCGGGCTCC 
GCCTCCGCCT CCCTCCCGGC CGCCGCCATC GAGCTGTGGC ACGGATTCTC GGCGCCCGCC 
GAGGTGAAGG CGTTCGAGGA CGCCATCGCC GGGTTCCGCC AGAAGTTCCC GCAGATCACC 
GTCAAGCTGG TCAAGGGAGT CCAGGACGAC CAGATCACCC AGGCGGTGCG CGGAGGGAAG 
GCCCCGGACG TCGCGTCCTC CTTCACCACC GACAACGTCG CCCAGTGGTG CAAGAGCGGA 
ACGTTCCAGG ACCTCACCCC GGTGATCAAG CAGGACGGCA TCGACCTGTC GGTGCTGCCG 
GAGGCCTCGC GCTCCTACAC CGAGTTCGAC GGCAGACGCT GCGTGATGCC GCTGCTCGCC 
GACGCCTACG GGCTCTACTA CAACAAGGCC CTGATGAAGG GCGAGCAGCC GCCCAAGACG 
CTGTCGGAGC TGACCGAGCT CACCAAGAAG CTCACGGTCC GCGACGCCGA CGGGACCATC 
AAGGTCGCCG GTTTCATCCC GAGCTTCGAG TACTACGAGA ACACCGCCTC GCACCTCGCC 
CCCATGGTCG GCGCCAAGTG GTACAACCCG GACGGCACCT CGGCGATCGG CTCCGACCCG 
GCCTGGAAGC AGCTCCTGCA GTGGCAGAAG GAGCTCGTCG ACTGGTACGG CCACGACAAG 
CTCGACAAGT TCCGCAAGAG CCTGGGCCAG GAGTGGTCGG CCGACCACCC GTTCTACAAG 
GGCAAGGTCG CCATGGTGCT CGACGGCGAA TGGCGCAACG CCATGATCGC CAATGAGGCC 
AAGGACCTGG ACTACGGCAC CGCACCGCTC CCGGTCGCCG ACGACAAGCC CGACCTGTAC 
GGCAGCGGCT TCACCGCGGG CACGGTGATC GGCGTGCCCA AGGGCGCCAA GAACCCGCAG 
GCCGCCTGGG AGCTGGTGAA GTATCTGACC ACCGACACCA CCGCCCTGGT CACCCTCTCC 
AACGCCCTGC GCAACGTGCC GACCACCAAG GCCTCGCTGG AGTCGCCGGA CCTGAAGAAG 
GACGCGAACT TCCAGACCTT CATCGACATC TTCGCCCACC CCAGGACCAG CACGATGCCC 
TCCAGCGTCA ACAGCACCTT CAACCAGGAG GCGATCCAGG AGTTCATGCA CCAGTGGGAG 
AAGGGCTCGG TCAAGGACCT CGACGCCGGG CTCGCCGGGG TCGACAAGCG TGTCAACGAC 
AAGCTGAAGC TCTCCGGGGG CTGA

Protein sequence

MHRRFLILAT AALTAGALTA CTAGNQSAPA LGAQPKPSGS ASASLPAAAI ELWHGFSAPA 
EVKAFEDAIA GFRQKFPQIT VKLVKGVQDD QITQAVRGGK APDVASSFTT DNVAQWCKSG 
TFQDLTPVIK QDGIDLSVLP EASRSYTEFD GRRCVMPLLA DAYGLYYNKA LMKGEQPPKT 
LSELTELTKK LTVRDADGTI KVAGFIPSFE YYENTASHLA PMVGAKWYNP DGTSAIGSDP 
AWKQLLQWQK ELVDWYGHDK LDKFRKSLGQ EWSADHPFYK GKVAMVLDGE WRNAMIANEA 
KDLDYGTAPL PVADDKPDLY GSGFTAGTVI GVPKGAKNPQ AAWELVKYLT TDTTALVTLS 
NALRNVPTTK ASLESPDLKK DANFQTFIDI FAHPRTSTMP SSVNSTFNQE AIQEFMHQWE 
KGSVKDLDAG LAGVDKRVND KLKLSGG