Gene Sros_5701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5701
Symbol
ID	8668995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6234438
End bp	6236261
Gene Length	1824 bp
Protein Length	607 aa
Translation table	11
GC content	67%
IMG OID
Product	ABC-type dipeptide transport system periplasmic component-like protein
Protein accession	YP_003341192
Protein GI	271966996
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.167771
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGAC TAGCAGCTGT AGCGGCGTTG CTCGGCCTCG CCGCCGTCAC GGCGTGCAGC 
GGCAGTACCG GAGACAAGCC CGCCGCCAGC GGCGGCAGCG GCGGCAGCGG CGGCGGTCTC 
TACACCACGA TCGACGGACT CAAGCCCGGC CTCGACGTCA ACGGGCCGAT CAACCCGTGG 
AACCCCAAGG GCAACGCGTT CGTCGGGCTC AACGCCATGC GGATCGCCTG GTCGAAGAAC 
CACATGACCG ACCCGAACCA GTTCTACCCG GGCATCGCGG AGAGCTGGGA GATCGCGCCG 
GACAACTCCT CGATCACGCT GCACCTGCAC CCGGACAACA AGTGGTCCGA CGGCAAGCCG 
GTCACCGCCG AGGACGTGAA GTTCTCCATC GCCCTGGCCT ACACGCAGGG CAGCACCGCC 
TTCGCGATCG ACCCGGGCGC GGCGGGCGCA GCCTCCGAGG TCGAGGTGGT CGACGACAAG 
ACCGTCAAGA TCACCCAGGA CATGGACAAC CCCAGCGTCA CGTTCGTGCG CGGCGTCATG 
GACAGCTACA TCGTGCCCCA GCACGTCTGG AGCAGCGTGC TGACCGCCGA TTTCTGGGAC 
AAGCTGAAGG CCGCCCGCGG CGAGGGTGCC GAGGCCGAGA AGGCCCGCGA GGAGATCACC 
GCGCTGTCGG AGAAGGTCCT CGCCTTCGCC CCGCCCAAGG ACGTCTCCGC CGGCCCGTTC 
ACGCTGGAGC GGATGAACCC GAGCGAGGCG CTGCTGGTCA AGAACAAGAA CTTCTACAAC 
GCCGCGAACG TCGGGCCCGA CCAGGTCAAG CTGCTCAACT ACACCGGCAA CGAGCAGATC 
TGGAACTACC TCATCGCCGG CAAGCTCGAC AACGCGCCGT TCACCGCCGT GCCCGCCGAC 
GTGATGAAGC GCATCAGCAG CACCCCGGGC AACGGGGTGA TCAAGGGCTA CTCGCCGGTG 
TCGCTGGGCA TGGCCTTCAA CCAGGCCAAG AAGCCCTACG ACAACGTGCA CGTGCGGCGC 
GGCCTGGCCT ACCTGATCAA CCGGGACGAG ATCACCAAGA TCGCCTCGCC GGAGGGCGGC 
ACCCCGGCGC TCACCACCAC CGGTATCCAC CAGAAGCCCG CCGCGGAGTG GCTCGGCGCC 
GACCTCGCCA CGCTGGAGCC GTACAAGCTC GACGCGGCCA AGGCCGAGGA GGAGTTCAAG 
AAGGCGGGCC TGAAGAAGGA CGGCGGCAAG TGGACGCTGC CCGACGGCAC GCCGTGGAAG 
TTCACCGTCA ACGTCCCGGC GCCGTTCTCC GACTGGATCT CCGGCGCCAA GGCGATCACC 
AGCCAGCTCA CCGAGGCGGG GATCGACGCC GAGGTCGTGA CCACCGCCGA CTACCCGCTG 
TACCTCAAGG AGATCGCCGA GGGCAAGTAT GACGTCGGGT TCTGGCTGAT CGCGCTCGGC 
CCCGCGCCGT ACAACATCTA CCAGCGCCTC TACGGTGCCT CCAACGGGTG GTCCATCCTC 
GGCGGCAAGA TCAAGCACGC CGAGCCCGGC AAGAACGGCA ACTGGATGGG CGGCCCGGAG 
ACCATCGAGG TCGACGGGGC CAAGGTCAAC CCCGGTGAGC TCACCGCCAA GCTGAACTCC 
GCCTCCGGCG ACGAGCAGAA GAAGATCATC GGCCAGCTCG CCAAGGCGGC CAACCAGGAC 
CTGCCGGTGG TCCAGCTCTG GGACTACGTC AACACCCAGT TCGTCAACAC CAACCGCTTC 
TCCGGCTTCC CCGAGAACGA CAGCGACCTG CTCCGCCAGC CCTCCGGCGT GTGGATCCAG 
CTCGGCATGG TCAAGAAGCA GTAA

Protein sequence

MKRLAAVAAL LGLAAVTACS GSTGDKPAAS GGSGGSGGGL YTTIDGLKPG LDVNGPINPW 
NPKGNAFVGL NAMRIAWSKN HMTDPNQFYP GIAESWEIAP DNSSITLHLH PDNKWSDGKP 
VTAEDVKFSI ALAYTQGSTA FAIDPGAAGA ASEVEVVDDK TVKITQDMDN PSVTFVRGVM 
DSYIVPQHVW SSVLTADFWD KLKAARGEGA EAEKAREEIT ALSEKVLAFA PPKDVSAGPF 
TLERMNPSEA LLVKNKNFYN AANVGPDQVK LLNYTGNEQI WNYLIAGKLD NAPFTAVPAD 
VMKRISSTPG NGVIKGYSPV SLGMAFNQAK KPYDNVHVRR GLAYLINRDE ITKIASPEGG 
TPALTTTGIH QKPAAEWLGA DLATLEPYKL DAAKAEEEFK KAGLKKDGGK WTLPDGTPWK 
FTVNVPAPFS DWISGAKAIT SQLTEAGIDA EVVTTADYPL YLKEIAEGKY DVGFWLIALG 
PAPYNIYQRL YGASNGWSIL GGKIKHAEPG KNGNWMGGPE TIEVDGAKVN PGELTAKLNS 
ASGDEQKKII GQLAKAANQD LPVVQLWDYV NTQFVNTNRF SGFPENDSDL LRQPSGVWIQ 
LGMVKKQ