Gene Sros_6106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6106
Symbol
ID	8669404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6696957
End bp	6699314
Gene Length	2358 bp
Protein Length	785 aa
Translation table	11
GC content	69%
IMG OID
Product	GTP diphosphokinase
Protein accession	YP_003341580
Protein GI	271967384
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.364718
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.643206
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCCGTG ATGTGGTCGT CCCCGACGTG ACCGCCGACG GCGGCGGTCC CGTGACGGCC 
GTCCCGGCCG GCGATGCCGG TTCCGCCATG TCCGGAGCCA CCGAAGAGAA GCCTGCGGTG 
AGGCGCAGAC TCGCGCGCTT TGGGGGGCAA TGGGGTGGCG CCATGAACCC GGTGCTGGAG 
CCGCTGTTCC GGACGGTCCG TGCGACCCAT CCGAAGGCAG ACCTGCGGCT GATCGAGCGT 
GCCTACGATG TGGCCGCCTA CCACCATCGC GATCAGAAGC GCAAGAGCGG CGACCCCTAC 
ATCACCCACC CCCTGGCGGT GGCGACGATC CTGGCCGAGC TCGGCACCGA CGACGAGACG 
CTGTGCGCCG CGCTGCTGCA CGACACCGTC GAGGACACCG CCTACGGCCT GGACGAGCTG 
CGCTCGGACT TCGGCGACAA CATCGCGCTG CTGGTCGACG GCGTCACCAA GCTCGACAAG 
GTCAAGTTCG GTGACGCCGC GCAGGCCGAG ACCGTGCGCA AGATGGTCGT GGCGATGTCC 
CGCGACATCC GGGTGCTGGT GATCAAGCTC GCCGACCGGC TGCACAACAT GCGCACCATG 
CGCTACCTCC CCGAGCACAA GCGGCAGCAG AAGTCCCGCG AGACGCTGGA GATCTTCGCG 
CCGCTCGCCC ACCGGCTGGG CATGAACACC ATCAAGTGGG AGCTGGAGGA CCTCGCGTTC 
GCCATGCTCT ACCCCAAGCG CTACGACGAG ATCGCCAGGA TGGTGTCGGA GCGGGCCCCG 
CGCAGGGACC TGTTCCTGCA GGAGGTCATC GAGAAGGTCT CCGGCGACCT GCGCGAGGCC 
AAGATCCGCG CGGTGGTCAA GGGACGCCCC AAGCACTACT ACTCGGTCTA CCAGAAGATG 
ATCGCCAGGG ACGTCGCCTT CGACGACATC TACGACCTGG TCGGCATCCG GGTGCTGGTC 
GACACGGTCC GCGACTGCTA TGCCGCCCTC GGAACGATCC ACGCGCGATG GAACCCGGTG 
CCCGGCCGGT TCAAGGACTA CATCGCGATG CCCAAGTTCA ACATGTACCA GTCGCTGCAC 
ACCACGGTGA TCGGCCCCGA GGGCAAGCCG GTGGAGCTGC AGATCCGCAC CCACGCCATG 
CACCACAGGT CCGAGTACGG CGTGGCCGCG CACTGGAAGT ACAAGGAGGA CATGACGGCC 
GCCGGTCCTC CCGGAGCGAA GCTGAAGCCC GGCAACGACA TGGCGTGGCT CCGCCAGCTC 
CTGGACTGGC AGAAGGAGAC CGCCGACCCG GGGGAGTTCC TGGAGTCGCT CAGGTTCGAC 
CTGTCGGTCT CGGAGGTGTA CGTCTTCACC CCGCGGGGCC AGGTGATCGC CCTCCCCGAG 
GGTGCGACGT CGGTCGACTT CGCCTACGCC GTCCACACCG AGGTCGGGCA CCGCTGCATC 
GGGGCCCGGG TCAACGGCCG CCTGGTGCCG CTGGAGTCGC GGCTGGGCAA CGGCGACACC 
GTCGAGATCT TCACCTCCAA GTCGCCCGAC GCGGGCCCGT CGCGTGACTG GCTCAAGTTC 
GTCAAGTCCG GCCGGGCCCG CAACAAGATC CGTCAGTGGT TCTCCAAGGA GCGCCGCGAG 
ACCGCGATCG AGGCGGGCAA GGAGGCCATC GGCCGGGCCA TGCGCAAGCA GGGCCTGCCG 
CTGCAGCGCA TGATGTCCGG AGAGTCCCTC CTGACCCTCG CCAGGGACCT GCGCTATCCC 
GACGTCTCCG CGCTCTACGC GGCCGTTGGA GAGGGCCACA TCGCCGCCCA GGCGGTCGTG 
CAGAAGCTGG TGCACTCCCT CGGCGGGGTG GACGGCGCGG AGGAGGACAT CGCCGAGGCC 
TCGGTGCCCA CGAAGGTGCG GGGCCGGCCC CGCGGCAGCG GCGGCGCGGG CGTGGTGGTG 
GCGGGTGACT CGGACGTGTG GGTACGGCTG TCGCGCTGCT GCACCCCCGT GCCCGGTGAC 
GAGATCATCG GCTTCGTCAC CCGTGGGCAC GGCGTGTCGG TGCACCGCAC CAACTGTCCC 
AACGTGGAGC AGCTGAAGTC CCAGCCGGAC CGGCTGGTCG AGGTGGCCTG GTCGGCCGCG 
GACGACTCGG TGTTCCTGGT CGCCCTGCAG GTCGAGGCGC TCGACCGGCC ACGTCTGCTG 
TCGGATGTGA CCCGGACCCT GTCGGACCAG CACGTGAACA TCCTGTCGGC GTCGGTGACG 
ACGTCCAGGG ACCGGGTGGC GATCAGCAAG TTCACCTTCG AGATGGGCGA CCCCAAGCAC 
CTGGGGCACG TCCTGAAGGC CGTGCGCAAC ATCCCCGGTG TCTACGACGT CTACCGGGTG 
AGCGGCGCCG GAGCCTGA

Protein sequence

MPRDVVVPDV TADGGGPVTA VPAGDAGSAM SGATEEKPAV RRRLARFGGQ WGGAMNPVLE 
PLFRTVRATH PKADLRLIER AYDVAAYHHR DQKRKSGDPY ITHPLAVATI LAELGTDDET 
LCAALLHDTV EDTAYGLDEL RSDFGDNIAL LVDGVTKLDK VKFGDAAQAE TVRKMVVAMS 
RDIRVLVIKL ADRLHNMRTM RYLPEHKRQQ KSRETLEIFA PLAHRLGMNT IKWELEDLAF 
AMLYPKRYDE IARMVSERAP RRDLFLQEVI EKVSGDLREA KIRAVVKGRP KHYYSVYQKM 
IARDVAFDDI YDLVGIRVLV DTVRDCYAAL GTIHARWNPV PGRFKDYIAM PKFNMYQSLH 
TTVIGPEGKP VELQIRTHAM HHRSEYGVAA HWKYKEDMTA AGPPGAKLKP GNDMAWLRQL 
LDWQKETADP GEFLESLRFD LSVSEVYVFT PRGQVIALPE GATSVDFAYA VHTEVGHRCI 
GARVNGRLVP LESRLGNGDT VEIFTSKSPD AGPSRDWLKF VKSGRARNKI RQWFSKERRE 
TAIEAGKEAI GRAMRKQGLP LQRMMSGESL LTLARDLRYP DVSALYAAVG EGHIAAQAVV 
QKLVHSLGGV DGAEEDIAEA SVPTKVRGRP RGSGGAGVVV AGDSDVWVRL SRCCTPVPGD 
EIIGFVTRGH GVSVHRTNCP NVEQLKSQPD RLVEVAWSAA DDSVFLVALQ VEALDRPRLL 
SDVTRTLSDQ HVNILSASVT TSRDRVAISK FTFEMGDPKH LGHVLKAVRN IPGVYDVYRV 
SGAGA