Gene Sros_1661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1661
Symbol
ID	8664938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1776668
End bp	1777933
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	71%
IMG OID
Product	Glycine hydroxymethyltransferase
Protein accession	YP_003337395
Protein GI	271963199
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCAG AGCCGTACTA CGGGCCCGAC TTCGGGCTCC TGCACAGGCA GGACCCAGAG 
GTCGCGCAGG TCCTCCTCGA CGAGCTCGAT CGGCTCCGCG GTGGCCTCCA GCTCATCGCC 
AGCGAGAACT TCGCCTCGCC GGCGGTGCTC GCCGCGCTCG GATCGACGCT CACCAACAAG 
TACGCCGAGG GGTATCCCGG CAGGCGCTAC TACGCCGGCT GCGAGGTCGT CGACCGGGCC 
GAGCGGCTCG CGATCGACCG GGCCAGGCGG CTGTTCGGCG CCGACCACGT CAACGTCCAG 
CCGCACTCGG GCGCCTCGGC GAACCTGGCG GCCTACGCCG CGCTGCTCCA GCCGGGCGAC 
ACGGTGCTGG CCATGGAGCT GTCACACGGC GGCCACCTCA CCCACGGTTC CAAGGTCAAC 
TTCTCCGGCC GGTGGTTCGA CGTCGTCGCG TACGGCGTGC GCAGGGACAC CGAGCTGATC 
GACTACGACG AGGTCAGGGA GCTGGCGCTG CGGCACCAGC CCAAGATGAT CATTTGTGGT 
GCCACGGCCT ACCCGCGTGA GATCGACTTC GCCGCCTTCC GGGGGATCGC GGACGAGGTC 
GGCGCCTGGC TGCTGGCCGA CGTCGCCCAC ACCGTCGGCC TGATGGCCGG AGGCGCCCTG 
CCGTCCGCCG TGCCGTACGC CGACGTGGTC ACCTTCACCA CGCACAAGGC GCTGCGCGGT 
CCGAGAGGCG GCGGGATCAT GTGCACGCGG GAGCTGGCGG CCCGGATCGA CCGGGCGGTC 
TTCCCGTTCG TCCAGGGAGG CCCGCTCATG CACGCGGTGG CGGCCAAGGC GGTGGCGTTC 
GGTGAGGCGC TCCGGCCGGA GTTCGCCGAC TACGCGCGCC AGGTGGTGGC CAACGCCCAG 
GTGCTGGCCG ACGCGCTGGC CGCCGAGGGG ATGCGGCCCG TCTCCGGGGG CACCGACAGC 
CATCTGGCCC TGATCGACCT GCGCGACGTC GGGGTCACCG GTGCGGTGGC CGAGCAGCGG 
TGCACCGCCG CAGGGATCAC ACTGAACCGC AACACCATCC CCTACGACCC CGAGCCGCCC 
ACGGTGACGT CCGGGATACG GGTGGGAACC CCCTGTGTCA CGACGCAGGG GATGGGGGCC 
GAGCAGATGA AAGAGGTGGC CTCGCTGGTG GCACAGGTCA TCCGTAACCC TGACGCAGTG 
GGAGAGACCA GGGCGCGGGT GGCGGCCCTC ACGGAGATCC ATCAGATATA TCCCAGCGAA 
CTATGA

Protein sequence

MGAEPYYGPD FGLLHRQDPE VAQVLLDELD RLRGGLQLIA SENFASPAVL AALGSTLTNK 
YAEGYPGRRY YAGCEVVDRA ERLAIDRARR LFGADHVNVQ PHSGASANLA AYAALLQPGD 
TVLAMELSHG GHLTHGSKVN FSGRWFDVVA YGVRRDTELI DYDEVRELAL RHQPKMIICG 
ATAYPREIDF AAFRGIADEV GAWLLADVAH TVGLMAGGAL PSAVPYADVV TFTTHKALRG 
PRGGGIMCTR ELAARIDRAV FPFVQGGPLM HAVAAKAVAF GEALRPEFAD YARQVVANAQ 
VLADALAAEG MRPVSGGTDS HLALIDLRDV GVTGAVAEQR CTAAGITLNR NTIPYDPEPP 
TVTSGIRVGT PCVTTQGMGA EQMKEVASLV AQVIRNPDAV GETRARVAAL TEIHQIYPSE 
L