Gene Sros_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1971
Symbol
ID	8665253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	2115486
End bp	2116736
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	67%
IMG OID
Product	Coenzyme F420-dependent N5 N10-methylene tetrahydromethanopterin reductase-like protein
Protein accession	YP_003337702
Protein GI	271963506
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTCT CGATATTCCT CAACCCGCAG ATCCCCGGCT CCGGATACTC CAACGAGGAG 
AACGCGGTCG CCAAGCGGCC GATCGGGCGG GACGTCGAGT CCTATCAGGC GCTGCTCCAC 
GAGGTCCGCG AGATCGCGAT CCACGCCGAC CAGATCGGCT TCGACGCGCT GATGATGACC 
GAGCACCACT TCCACTCCGA GGGCTTCGAG TTCTCGGTGA ACCCGCTGAT GTTCCTCACC 
GACCTGGCGG CCAGGACCGA GCGCATCCTG CTGGCCCCGC TGGGCATCGT GCTGCCCGCC 
TGGGACCCGA TCAGGGCGGC CGAGGACGTG GCCCTTCTGG ACCAGTTCAG CAAGGGACGG 
CTCCGCCTGG GCGTGGCCCG CGGCTACCAG AACCGGTGGA TGAACGTGCT GGGCCAGCGC 
TGGCAGGCCT CCGCCGCCCG CTCCGACGGC TCCAAGAGCG ACACCCGCAA CTTCGACGTC 
TTCGGCGAGG TCCTGAAGAT CATGAAGATG GCGTGGACCC AGGACACGCT GCGCTACAAG 
TCCGACGTGC TGGACTACGA GGTGCCCGCG CCGTTCGACG GCATCGAGGG CTGGCCCGCG 
CTGGAGTGGA CCCAGAAGTT CGGCGCGCCG GGCGAGGTGG ACGACCAGGG CAGGATCCAT 
GCCGTCTCGG TCGGGCCCAA GCCGTACCAG TATCCGTATC CGGAGCTGTG GCAGCCGTTC 
ACCATCTCCG ACCGCTCGGT GATCCGGGCC GCGCAGGAGG ACATCCTGCC GTGGATGTTC 
ACCCCGAACC CGGACGAGCA CGCCGCCAAG GCCAAGCTCT ACCAGGAGGA GTCGGCCAAG 
TGCGGCCGCG ACTACAAGCT GGGCGAGCAC ACCGGCATCC TCAAGATCGT CGGCATGGCC 
GACACCCGCG AGGAGGCCAT CGCCACCTAC GGCAAGAGCA TGCAGAAGGA CTTCGCCGCC 
TTCTTCGGCC CGTTCGGCTA CCTGGAGGTC CTCCGCAAGA AGGAGGACGA CAGGCACCAG 
CCGATCAGCC CGGAGAAGGG CGACTACAAG CGCATGAACG AGGTCGAGAT GGCCCTGCTG 
GGCGGTCCCG ACGACGTCAA GCGCGGCATC CAGCGCATGC TCGACCGGAT GCCCGACCTG 
GAGTGGTTCG GCCTGTTCAT GCAGGGACAG CAGGGGGTCC TCCCCCTCGA CACCGTCAAG 
CGCAACCTCG AACTCTTCGC CACCAAGGTC ATCCCCGAGT TCTCCGACTG A

Protein sequence

MKFSIFLNPQ IPGSGYSNEE NAVAKRPIGR DVESYQALLH EVREIAIHAD QIGFDALMMT 
EHHFHSEGFE FSVNPLMFLT DLAARTERIL LAPLGIVLPA WDPIRAAEDV ALLDQFSKGR 
LRLGVARGYQ NRWMNVLGQR WQASAARSDG SKSDTRNFDV FGEVLKIMKM AWTQDTLRYK 
SDVLDYEVPA PFDGIEGWPA LEWTQKFGAP GEVDDQGRIH AVSVGPKPYQ YPYPELWQPF 
TISDRSVIRA AQEDILPWMF TPNPDEHAAK AKLYQEESAK CGRDYKLGEH TGILKIVGMA 
DTREEAIATY GKSMQKDFAA FFGPFGYLEV LRKKEDDRHQ PISPEKGDYK RMNEVEMALL 
GGPDDVKRGI QRMLDRMPDL EWFGLFMQGQ QGVLPLDTVK RNLELFATKV IPEFSD