Gene Sros_7456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_7456
Symbol
ID	8670777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	8243771
End bp	8245462
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	66%
IMG OID
Product	ABC-type dipeptide transport system, periplasmic component
Protein accession	YP_003342882
Protein GI	271968686
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.388989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGG TTAGATTCGC AGCCACAGCC GGCGCGCTGG GGCTGGCGTT GCTGCTGACC 
GCGTGCTCGC CGGGCACCTC GGGCGGTGCC CGGGAGACCA CCACCAACGC CGCCGGCGGC 
ACGTCGGACT CGATCAGCCT GCGCATCAAC AACGCCACCA CGTACTCCCG CAACTTCAAC 
ATCTACTCCC CCTCCACCGA CATCGCCCCG CAGATCAGCC TCATCTATGA GCCGCTGGTG 
CGCCGCAACG TCCTCAAAGG CGGCCGGCTG GAACCGTGGC TGGCCGAGTC GTGGGAGTGG 
AGCGACGGCG ACAAGACCGT CACCCTCAAG CTCCGCACCG ACGTGAAGTT CTCCGACGGC 
ACGCCGATGA CCAGCAAGGA CGTCGCCTTC ACGCTGAACA TCTCGCTGGA GCACCCCGAG 
CTGAACACCG GCGGCCAGAC CTACGTCTCG GCCGAGGCGA CCGACGACCA CACCGTGGTC 
GTCAAGTGGA AGAAGCCCGC GCAGCTCGAC TTCTACCGCT TCGCGCTCGG CGTCACCGGC 
TTCGCGCCCC GGATCGTTCC CGAGCACATC TGGAAGGACA AGGACCTCAA GACCTGGACG 
AACCCCGACC CGATCGGCAC AGGCGTGGGC AAGCTCACCC AGTTCACCCC GCAGCAGTTC 
ACCCTGGAGA CGCGCGCGGA CTACTGGGGC GGCCAGTTCC CGATGAAGTC GATCAAGATC 
GTCGCGACCG GCGGTGACGA CCAGACCAAG GCGCGCCTGC TCAAGGGTGA CATCGACTAC 
GCCACCATTT CCTGGCCGAA CGCCGAGCAG GAATACATGG CCCGGAACCC GAAGGCCAAC 
GTCTACAAGA CGTTCCACAC CGGCGGGGAG GAGTCGCTGC TGTTCAACCT GGCCAAGGAG 
CCCTTCTCCG ACGTCAACGT GCGCAAGGCG CTGGCCATGA GCGTGGAACG TGCCAGCGTG 
CTCAAGCTCG CCCCCACCGG CCAGGAGCCG GCCAACGCCT GTGGCCTGGA GCCGCAGGTG 
TACGCCGAGT TCATGGCGCC GGAGTGCAAG CCGCAGCCCC TCGACGTCGA GGGCGCCAAG 
AAGGCCCTGG CCGACGGCGG CTGGACCGTC GAGGGCGGCC GGCTCGCCAA GGACGGCAAG 
ACCTACCCGC TGAGCATCAA GGTCGTGCAG GAGTACGCCA ACTGGATGGC CTACGGCAAG 
GGCATGCAGG ACCAGTGGAA GTCCAACCTG GGCCTGGACG TGAAGGTCAT GGCCATCCCC 
GAGGAGAACT ACGACCCGCA GCTCAACGAG GGCGACTACG ACATGGCCCT CTACTGGACC 
GGCAACTCCA ACGGCCTGTA CTCCGTCTTC GCCGACCAGC TCGACTCCGA CAAGTACAAG 
CCCATCGGCA AGGACGCCCA GTACCAGAAC CAGAGCCGCT GGAAGGACAC GTCCACCACG 
CCGCTGCTCG ACAGGCTGCG CGACACCGTC GGCGACCCGG CCGCCCAGAC GGAGGCCGGC 
TACCAGCTCC AGAAGGTCGT GCTGGACCAG GTGCCGTTCT CCCCGATGTT CACCGCCGAC 
TGGTTCGTCG AGATGAACCA GTCCCGGTGG GTGGGCTGGC CCGAGACGGG CGAGACCGAC 
CACGTCCCGC ACAGCGCCCT CGGCCCTGAC ATCGTCATGA CCCTCAAGGG TCTCAAGCCC 
GCGGGCAAGT AG

Protein sequence

MKKVRFAATA GALGLALLLT ACSPGTSGGA RETTTNAAGG TSDSISLRIN NATTYSRNFN 
IYSPSTDIAP QISLIYEPLV RRNVLKGGRL EPWLAESWEW SDGDKTVTLK LRTDVKFSDG 
TPMTSKDVAF TLNISLEHPE LNTGGQTYVS AEATDDHTVV VKWKKPAQLD FYRFALGVTG 
FAPRIVPEHI WKDKDLKTWT NPDPIGTGVG KLTQFTPQQF TLETRADYWG GQFPMKSIKI 
VATGGDDQTK ARLLKGDIDY ATISWPNAEQ EYMARNPKAN VYKTFHTGGE ESLLFNLAKE 
PFSDVNVRKA LAMSVERASV LKLAPTGQEP ANACGLEPQV YAEFMAPECK PQPLDVEGAK 
KALADGGWTV EGGRLAKDGK TYPLSIKVVQ EYANWMAYGK GMQDQWKSNL GLDVKVMAIP 
EENYDPQLNE GDYDMALYWT GNSNGLYSVF ADQLDSDKYK PIGKDAQYQN QSRWKDTSTT 
PLLDRLRDTV GDPAAQTEAG YQLQKVVLDQ VPFSPMFTAD WFVEMNQSRW VGWPETGETD 
HVPHSALGPD IVMTLKGLKP AGK