Gene Sros_1887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1887
Symbol
ID	8665165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	2005219
End bp	2006286
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	78%
IMG OID
Product	N-acetylglucosamine kinase-like protein
Protein accession	YP_003337618
Protein GI	271963422
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGTTC TCGGACTGGA CGTCGGCGGC ACCTCCTCGC GCGCGCTCCT GCTCGACGCC 
TCGGGGCGGC GGATCGGGTA CGGCAGGGCT CCCGGCGGCA ATCCGGCGGC CCACGGCACC 
GGCACGGCCG CCGCCAACAT CCGGCAAGCG CTGGAGCCCG CCCTCCTCGG GGTGGACCCG 
GCGGAGGTGG TGGGGGCGGT CGTCGGGATG GCCGGGGTCG GGGCGCTCGA CCGGGCCGTC 
TTCGACCGGA TGTGGGCCTC CGCCGGGCTG CGCTGCGTCC CTGCCGTGAC GGGCGATCTC 
GGCGTCGCCT TCGCCGCCGG TACGGCGGAG CCGCGCGGCA CCGTGCTCAT CGCGGGGACC 
GGCGCCATCG CCGCCCGCAT CGAGGACGGC GAGCCGGTGG CGGTCTCCGA CGGGCTCGGC 
TGGCTGCTCG GGGACCAGGG ATCGGGTTTC TGGCTGGGGC GGGAGGCGGC CCGCGCGGCC 
GTCCGGGGTC TGAGCCGGGG CGAGAGCGAC GGCCTGCTGA CGCGCCTGGT CGCCGAGGAG 
ATCCGCGACA GCGACGGCCG TGACGGCCCT GACGGCCGCG GTGTCCAGGA CAGTCGGGAT 
GGCCACGACG TCCGCGACGG TCGGGACGTC CAGGACGGTC GGGATGGCCG CGATGGTCGC 
GCGGCCGGAT GGCCGCCCGT GGACGGCAGG GCGGAGGCCA TCCGGCTCGT GGTCCACGCC 
CAGGGACACT CCCCGCTGGA GCTGGCGAGG CTGGCGCCGC TGGTGAGCCG GGCCGCCGCC 
GCGGGCGACC CCGACGCGCT GAAGATCGTG GCGACGGCGG CCGGGCTGCT CTGCGCGACG 
GTGGCCGAGG TGCGCCAGGA GGGGGAGGAC ACCCCCATCG TGCTGGCCGG GAGCGTGCTG 
ACCAGCGAGG GGCCGGTGTG CTCCGCCGTA CGGGACGGGC TCGGCGCGCC GACGGCCCTG 
GCCGGCGACG GTGCCGCGGC GGCGGCCTGG CTGGCGGCGA AGGAGGCGTT CGGCCTGGAC 
CGGGAGGCGG CGGCGCGGCT CCACCGGCGG ATCCTGCGGG AGGCGTGA

Protein sequence

MYVLGLDVGG TSSRALLLDA SGRRIGYGRA PGGNPAAHGT GTAAANIRQA LEPALLGVDP 
AEVVGAVVGM AGVGALDRAV FDRMWASAGL RCVPAVTGDL GVAFAAGTAE PRGTVLIAGT 
GAIAARIEDG EPVAVSDGLG WLLGDQGSGF WLGREAARAA VRGLSRGESD GLLTRLVAEE 
IRDSDGRDGP DGRGVQDSRD GHDVRDGRDV QDGRDGRDGR AAGWPPVDGR AEAIRLVVHA 
QGHSPLELAR LAPLVSRAAA AGDPDALKIV ATAAGLLCAT VAEVRQEGED TPIVLAGSVL 
TSEGPVCSAV RDGLGAPTAL AGDGAAAAAW LAAKEAFGLD REAAARLHRR ILREA